Thầy cô kiến thức thâm sâu
Học sinh chăm chỉ bước đầu thành công.

BÀI F16. MÁY TÍNH, THUẬT TOÁN VÀ KHOA HỌC DỮ LIỆU (CTST - CS)

BÀI F16. MÁY TÍNH, THUẬT TOÁN VÀ KHOA HỌC DỮ LIỆU (CTST - CS & ICT)
 Đây là bài soạn lý thuyết tin học 12 - sách Chân trời sáng tạo. Bài học này thuộc định hướng Khoa học máy tính (CS). Quý Thầy Cô và các em học sinh truy cập để làm tài liệu tham khảo nhé. Chúc Thầy Cô dạy tốt, chúc các em học sinh học giỏi.

1. Vai trò của máy tính đối với sự phát triển của Khoa học dữ liệu
- Máy tính đóng vai trò nền tảng trong Khoa học dữ liệu nhờ năng lực tính toán mạnh, lưu trữ lớn, tốc độ xử lí cao, xử lí đa nhiệm và kết nối mạng.
- Sự phát triển của các công nghệ như GPU, TPU, điện toán đám mây, máy tính lượng tử,... đã thúc đẩy Khoa học dữ liệu xử lý dữ liệu lớn hiệu quả hơn.
- Quy trình Khoa học dữ liệu gồm các bước:
 + Xác định vấn đề
 + Thu thập dữ liệu
 + Chuẩn bị dữ liệu
 + Xây dựng mô hình
 + Đánh giá
 + Triển khai
- Máy tính tham gia ở tất cả các bước: lưu trữ, xử lý, xây dựng mô hình, đánh giá hiệu suất, dự đoán...
2. Tính ưu việt của sử dụng máy tính và thuật toán trong xử lí dữ liệu lớn
- Dữ liệu lớn (Big Data) gồm 5 yếu tố chính:
 + Volume: khối lượng lớn
 + Velocity: tốc độ tạo dữ liệu cao
 + Variety: đa dạng định dạng
 + Veracity: độ tin cậy
 + Value: giá trị từ dữ liệu
- Máy tính mang lại nhiều lợi ích trong xử lý dữ liệu lớn:
 + Tốc độ xử lý cao
 + Hỗ trợ mô hình học máy trên dữ liệu lớn
 + Khả năng mở rộng với mạng máy tính
 + Lưu trữ, truy xuất, bảo mật dữ liệu hiệu quả
 + Phân tích dữ liệu theo thời gian thực
- Thuật toán tăng hiệu quả xử lý:
 + Xử lý song song trên nhiều hệ thống
 + Tự động hóa quy trình như làm sạch, đồng bộ dữ liệu
Ví dụ minh hoạ:
- GPT-3 (2020):
 + Xử lý 45 TB dữ liệu thô → 570 GB đầu vào
 + Sử dụng 1024 GPU A100 để huấn luyện 175 tỷ tham số trong 34 ngày
- AlphaFold 2 (2020):
 + Dự đoán cấu trúc protein chính xác trong vài giờ–ngày
 + Năm 2023, thuật toán Foldseek Cluster đã gom cụm ~2,3 triệu cấu trúc protein trong 5 ngày (thay vì hàng năm)
Sử dụng máy tính và thuật toán trong Khoa học dữ liệu cho phép xử lí dữ liệu lớn với tốc độ, độ chính xác và khả năng mở rộng cao, góp phần tạo ra các ứng dụng có giá trị trong khoa học và thực tiễn.

CÙNG CHUYÊN MỤC:
CHỦ ĐỀ A. MÁY TÍNH VÀ XÃ HỘI TRI THỨC
CHỦ ĐỀ B. MẠNG MÁY TÍNH VÀ INTERNET
CHỦ ĐỀ D. ĐẠO ĐỨC, PHÁP LUẬT VÀ VĂN HÓA TRONG MÔI TRƯỜNG SỐ
CHỦ ĐỀ E. ỨNG DỤNG TIN HỌC
CHỦ ĐỀ F. GIẢI QUYẾT VẤN ĐỀ VỚI SỰ TRỢ GIÚP CỦA MÁY TÍNH
CHỦ ĐỀ G. HƯỚNG NGHIỆP VỚI TIN HỌC

CÁC CHUYÊN MỤC LIÊN QUAN:
☎ TIN HỌC 10-KẾT NỐI TRI THỨC
☎ TIN HỌC 11-KẾT NỐI TRI THỨC
☎ TIN HỌC 12-KẾT NỐI TRI THỨC

Tổng số lượt xem

Chăm chỉ chiến thắng tài năng
khi tài năng không chịu chăm chỉ.

- Tim Notke -

Bản quyền
Liên hệ
Chat Zalo
Chat Facebook