Thầy cô kiến thức thâm sâu
Học sinh chăm chỉ bước đầu thành công.

BÀI 2. GIỚI THIỆU VỀ KHOA HỌC DỮ LIỆU (CÁNH DIỀU - CS)

Bài 2 - Giới thiệu về khoa học dữ liệu (Cánh diều - cs)
 Đây là bài soạn lý thuyết tin học 12 - sách Cánh diều. Bài học này thuộc định hướng Khoa học máy tính (CS). Lý thuyết được tóm tắt ngắn gọn, dễ hiểu, bám sát nội dung cốt lõi của bài học. Quý Thầy Cô và các em học sinh truy cập để làm tài liệu tham khảo nhé. Chúc Thầy Cô dạy tốt, chúc các em học sinh học giỏi.

1. Khoa học dữ liệu
a) Khái niệm khoa học dữ liệu
 - Khoa học dữ liệu là lĩnh vực liên ngành, kết hợp Toán học, Thống kê, Khoa học máy tính với kiến thức chuyên ngành.
 - Mục tiêu: Quản trị, phân tích dữ liệu để hỗ trợ ra quyết định và lập kế hoạch.
 - Ứng dụng trong nhiều lĩnh vực: Kinh doanh, tài chính, y tế, giáo dục,…
b) Các giai đoạn của một dự án khoa học dữ liệu
 1. Xác định vấn đề: Hiểu rõ bài toán cần giải quyết.
 2. Thu thập dữ liệu: Lấy dữ liệu từ nhiều nguồn khác nhau.
 3. Chuẩn bị dữ liệu: Làm sạch, xử lý dữ liệu, loại bỏ lỗi.
 4. Phân tích và khai phá dữ liệu: Tìm mối quan hệ, quy luật trong dữ liệu.
 5. Đánh giá và giải thích: Kiểm tra mô hình, đánh giá hiệu quả.
 6. Ra quyết định và triển khai: Sử dụng kết quả để tối ưu hóa hoạt động.
 Ví dụ: Dự báo số lượng hành khách tại sân bay để cải thiện quy trình làm việc.
2. Một số thành tựu của khoa học dữ liệu
a) Dự án Bộ gen người (HGP)
 - Nghiên cứu giải mã bộ gen người giúp hiểu rõ về bệnh tật và phát triển y học.
 - Dữ liệu lớn (hàng trăm petabyte) yêu cầu thuật toán phân tích mạnh mẽ.
b) Các dự án nghiên cứu và khám phá không gian vũ trụ
 - Kính thiên văn Kepler, TESS, Plato thu thập dữ liệu về hành tinh ngoài hệ Mặt Trời.
 - Học máy giúp phân tích quỹ đạo, phát hiện hành tinh có thể sống được.
c) Hệ thống Giám sát đánh bắt cá toàn cầu
- Sử dụng dữ liệu vệ tinh để phát hiện tàu đánh bắt cá bất hợp pháp.
d) Các mô hình ngôn ngữ lớn (LLM)
 - GPT-3 có 175 tỷ tham số, giúp AI hiểu và xử lý ngôn ngữ tự nhiên vượt trội.
e) Mô hình phát hiện gian lận của American Express
 - American Express dùng khoa học dữ liệu để giảm 60% gian lận thẻ tín dụng.
---The End!---
CÙNG CHUYÊN MỤC:
Chủ đề A
Chủ đề B
Chủ đề D
Chủ đề F
Chủ đề G
Chủ đề A (ICT)
Chủ đề E (ICT)
Chủ đề B (CS)
Chủ đề F (CS)
Chủ đề F (CS1)
Chủ đề F (CS1)

CÁC CHUYÊN MỤC LIÊN QUAN:
☎ TIN HỌC 10-KẾT NỐI TRI THỨC
☎ TIN HỌC 11-KẾT NỐI TRI THỨC
☎ TIN HỌC 12-KẾT NỐI TRI THỨC

Tổng số lượt xem

Chăm chỉ chiến thắng tài năng
khi tài năng không chịu chăm chỉ.

- Tim Notke -

Bản quyền
Liên hệ
Chat Zalo
Chat Facebook