BÀI 3. GIỚI THIỆU VỀ KHOA HỌC DỮ LIỆU (TT) (CÁNH DIỀU - CS)

Bài 3 - Giới thiệu về khoa học dữ liệu (tiếp theo) (Cánh diều - cs)
 Đây là bài soạn lý thuyết tin học 12 - sách Cánh diều. Bài học này thuộc định hướng Khoa học máy tính (CS). Lý thuyết được tóm tắt ngắn gọn, dễ hiểu, bám sát nội dung cốt lõi của bài học. Quý Thầy Cô và các em học sinh truy cập để làm tài liệu tham khảo nhé. Chúc Thầy Cô dạy tốt, chúc các em học sinh học giỏi.

1. Đặc trưng của dữ liệu lớn (Big Data)
 Dữ liệu lớn có các đặc điểm chính (5V):
  - Khối lượng (Volume): Dữ liệu có thể đạt mức petabyte hoặc exabyte.
  - Tốc độ (Velocity): Dữ liệu được tạo liên tục, cần xử lý nhanh.
  - Tính đa dạng (Variety): Dữ liệu có nhiều dạng khác nhau (văn bản, hình ảnh, video).
  - Tính xác thực (Veracity): Độ tin cậy và chính xác của dữ liệu.
  - Giá trị (Value): Dữ liệu mang lại thông tin có giá trị cho doanh nghiệp và xã hội.
2. Phân tích dữ liệu, phát hiện tri thức
a) Phân tích dữ liệu
 - Phân tích mô tả: Tóm tắt dữ liệu, biểu diễn trực quan bằng biểu đồ, đồ thị.
 - Phân tích dự đoán: Dự đoán xu hướng tương lai, kiểm định giả thuyết thống kê.
 - Phân tích chuỗi thời gian: Dự đoán dữ liệu theo chu kỳ (ví dụ: dự báo thời tiết).
 - Phân tích hồi quy: Xác định mối quan hệ giữa các biến số để dự đoán giá trị mới.
b) Khai phá dữ liệu, phát hiện tri thức
 - Khai phá dữ liệu: Tìm ra các mẫu, quy luật trong dữ liệu.
 - Phân loại và phân cụm: Ứng dụng trong thương mại, y tế, tài chính,…
3. Vai trò của máy tính và thuật toán ưu việt với khoa học dữ liệu
a) Máy tính là công cụ quan trọng trong khoa học dữ liệu
 - Máy tính giúp lưu trữ, xử lý dữ liệu lớn, tự động hóa quá trình phân tích.
 - Học máy (Machine Learning) và AI hỗ trợ phát hiện tri thức từ dữ liệu.
b) Máy tính và thuật toán ưu việt giúp phân tích dữ liệu hiệu quả
 - Siêu máy tính: Xử lý hàng nghìn tỷ phép tính mỗi giây.
 - Điện toán đám mây: Lưu trữ, phân tích dữ liệu linh hoạt, tiết kiệm chi phí.
 - Cơ sở dữ liệu NoSQL: Quản lý dữ liệu không cấu trúc (MongoDB, Apache Hadoop).
 - Máy tính cụm (Cluster Computing): Tập hợp nhiều máy tính để xử lý dữ liệu nhanh hơn.
 - Thuật toán song song: Giúp tăng tốc độ tính toán bằng cách chia nhỏ bài toán.
---The End!---
CÙNG CHUYÊN MỤC:
Chủ đề A
Chủ đề B
Chủ đề D
Chủ đề F
Chủ đề G
Chủ đề A (ICT)
Chủ đề E (ICT)
Chủ đề B (CS)
Chủ đề F (CS)
Chủ đề F (CS1)
Chủ đề F (CS1)

CÁC CHUYÊN MỤC LIÊN QUAN:

BÀI 2. GIỚI THIỆU VỀ KHOA HỌC DỮ LIỆU (CÁNH DIỀU - CS)

Bài 2 - Giới thiệu về khoa học dữ liệu (Cánh diều - cs)
 Đây là bài soạn lý thuyết tin học 12 - sách Cánh diều. Bài học này thuộc định hướng Khoa học máy tính (CS). Lý thuyết được tóm tắt ngắn gọn, dễ hiểu, bám sát nội dung cốt lõi của bài học. Quý Thầy Cô và các em học sinh truy cập để làm tài liệu tham khảo nhé. Chúc Thầy Cô dạy tốt, chúc các em học sinh học giỏi.

1. Khoa học dữ liệu
a) Khái niệm khoa học dữ liệu
 - Khoa học dữ liệu là lĩnh vực liên ngành, kết hợp Toán học, Thống kê, Khoa học máy tính với kiến thức chuyên ngành.
 - Mục tiêu: Quản trị, phân tích dữ liệu để hỗ trợ ra quyết định và lập kế hoạch.
 - Ứng dụng trong nhiều lĩnh vực: Kinh doanh, tài chính, y tế, giáo dục,…
b) Các giai đoạn của một dự án khoa học dữ liệu
 1. Xác định vấn đề: Hiểu rõ bài toán cần giải quyết.
 2. Thu thập dữ liệu: Lấy dữ liệu từ nhiều nguồn khác nhau.
 3. Chuẩn bị dữ liệu: Làm sạch, xử lý dữ liệu, loại bỏ lỗi.
 4. Phân tích và khai phá dữ liệu: Tìm mối quan hệ, quy luật trong dữ liệu.
 5. Đánh giá và giải thích: Kiểm tra mô hình, đánh giá hiệu quả.
 6. Ra quyết định và triển khai: Sử dụng kết quả để tối ưu hóa hoạt động.
 Ví dụ: Dự báo số lượng hành khách tại sân bay để cải thiện quy trình làm việc.
2. Một số thành tựu của khoa học dữ liệu
a) Dự án Bộ gen người (HGP)
 - Nghiên cứu giải mã bộ gen người giúp hiểu rõ về bệnh tật và phát triển y học.
 - Dữ liệu lớn (hàng trăm petabyte) yêu cầu thuật toán phân tích mạnh mẽ.
b) Các dự án nghiên cứu và khám phá không gian vũ trụ
 - Kính thiên văn Kepler, TESS, Plato thu thập dữ liệu về hành tinh ngoài hệ Mặt Trời.
 - Học máy giúp phân tích quỹ đạo, phát hiện hành tinh có thể sống được.
c) Hệ thống Giám sát đánh bắt cá toàn cầu
- Sử dụng dữ liệu vệ tinh để phát hiện tàu đánh bắt cá bất hợp pháp.
d) Các mô hình ngôn ngữ lớn (LLM)
 - GPT-3 có 175 tỷ tham số, giúp AI hiểu và xử lý ngôn ngữ tự nhiên vượt trội.
e) Mô hình phát hiện gian lận của American Express
 - American Express dùng khoa học dữ liệu để giảm 60% gian lận thẻ tín dụng.
---The End!---
CÙNG CHUYÊN MỤC:
Chủ đề A
Chủ đề B
Chủ đề D
Chủ đề F
Chủ đề G
Chủ đề A (ICT)
Chủ đề E (ICT)
Chủ đề B (CS)
Chủ đề F (CS)
Chủ đề F (CS1)
Chủ đề F (CS1)

CÁC CHUYÊN MỤC LIÊN QUAN:

BÀI 1. GIỚI THIỆU VỀ HỌC MÁY (CÁNH DIỀU - CS)

Bài 1 - Giới thiệu về học máy (Cánh diều - cs)
 Đây là bài soạn lý thuyết tin học 12 - sách Cánh diều. Bài học này thuộc định hướng Khoa học máy tính (CS). Lý thuyết được tóm tắt ngắn gọn, dễ hiểu, bám sát nội dung cốt lõi của bài học. Quý Thầy Cô và các em học sinh truy cập để làm tài liệu tham khảo nhé. Chúc Thầy Cô dạy tốt, chúc các em học sinh học giỏi.

1. Khái niệm học máy
 - Học máy (Machine Learning - ML) là một nhánh của trí tuệ nhân tạo (AI) giúp máy tính học từ dữ liệu.
 - Máy tính được huấn luyện bằng dữ liệu huấn luyện để có thể thực hiện nhiệm vụ trên dữ liệu mới.
a) Mô hình học máy
 - Thuật toán học máy giúp máy tính phát hiện mối quan hệ trong dữ liệu.
 - Mô hình học máy được huấn luyện từ dữ liệu để giải quyết bài toán cụ thể.
b) Quy trình học máy
 1. Thu thập dữ liệu: Lấy dữ liệu từ nhiều nguồn khác nhau.
 2. Chuẩn bị dữ liệu: Làm sạch, chuyển đổi, chia thành tập huấn luyện và kiểm tra.
 3. Xây dựng mô hình: Chọn thuật toán phù hợp (hồi quy, cây quyết định, mạng nơ-ron,…).
 4. Đánh giá mô hình: Kiểm tra hiệu suất, điều chỉnh để cải thiện.
 5. Triển khai mô hình: Ứng dụng vào thực tế.
2. Học có giám sát
 - Tập dữ liệu có nhãn giúp máy học mối quan hệ giữa dữ liệu và nhãn.
 - Ứng dụng tiêu biểu: Bài toán phân loại.
a) Bài toán phân loại
 Ví dụ: Phân loại email (Spam/No Spam).
b) Dữ liệu huấn luyện
 Máy tính học từ dữ liệu có nhãn để đưa ra dự đoán chính xác trên dữ liệu mới.
c) Huấn luyện và đánh giá mô hình
 Máy tính được huấn luyện bằng dữ liệu để dự đoán nhãn phân loại. Sau đó, mô hình được đánh giá bằng cách so sánh nhãn dự đoán với nhãn thật. Mục tiêu là giảm nhãn sai đến mức chấp nhận được.
2. Học không giám sát
 - Không có nhãn, máy tính tự nhóm dữ liệu dựa vào đặc điểm chung.
 - Ứng dụng tiêu biểu: Bài toán phân cụm.
a) Bài toán phân cụm
 Ví dụ: Nhóm các loại quả dựa vào màu sắc, kích thước.
b) Dữ liệu huấn luyện
 Máy tính nhóm dữ liệu dựa trên độ tương đồng giữa các mẫu.
c) Huấn luyện và đánh giá mô hình
 Phân cụm là quá trình nhóm dữ liệu dựa trên sự tương tự, thường dùng khoảng cách giữa các mẫu. Khác với học có giám sát, phân cụm không có nhãn nên không thể kiểm tra đúng sai trực tiếp.
4. Một số ứng dụng của học máy
a) Nhận dạng tiếng nói
 Điều khiển thiết bị thông minh, trợ lý ảo.
b) Nhận dạng chữ viết
 Chuyển chữ viết tay thành văn bản số hóa.
c) Dịch máy
 Google Dịch giúp dịch ngôn ngữ tự động.
d) Chẩn đoán bệnh
 Dự đoán bệnh dựa trên triệu chứng.
e) Phân tích thị trường
 Nhóm khách hàng theo nhu cầu để tối ưu tiếp thị.
---The End!---
CÙNG CHUYÊN MỤC:
Chủ đề A
Chủ đề B
Chủ đề D
Chủ đề F
Chủ đề G
Chủ đề A (ICT)
Chủ đề E (ICT)
Chủ đề B (CS)
Chủ đề F (CS)
Chủ đề F (CS1)
Chủ đề F (CS1)

CÁC CHUYÊN MỤC LIÊN QUAN:

BÀI 4. THỰC HÀNH VỀ NHẬN DIỆN THIẾT BỊ MẠNG VÀ THIẾT KẾ
MẠNG LAN (CÁNH DIỀU - CS)

Bài 4 - Thực hành về nhận diện thiết bị mạng và thiết kế mạng LAN (Cánh diều - cs)
 Đây là bài soạn lý thuyết tin học 12 - sách Cánh diều. Bài học này thuộc định hướng Khoa học máy tính (CS). Lý thuyết được tóm tắt ngắn gọn, dễ hiểu, bám sát nội dung cốt lõi của bài học. Quý Thầy Cô và các em học sinh truy cập để làm tài liệu tham khảo nhé. Chúc Thầy Cô dạy tốt, chúc các em học sinh học giỏi.

A. Nhận diện thiết bị mạng
1. Yêu cầu chung
 - Quan sát, nhận diện và thu thập thông tin về các thiết bị mạng.
 - Mỗi nhóm thực hiện 3 trong 4 nhiệm vụ sau:
  1. Nhận diện Switch.
  2. Nhận diện Router.
  3. Nhận diện Access Point.
  4. Nhận diện cáp mạng (cáp quang, cáp đồng trục).
2. Gợi ý và hướng dẫn
 - Bước 1: Phân công nhiệm vụ trong nhóm.
 - Bước 2: Quan sát thông tin thiết bị, điền vào bảng mẫu.
 - Bước 3: Thảo luận, thống nhất kết quả.
 - Bước 4: Soạn báo cáo (gồm trang bìa, bảng thông tin thiết bị kèm hình ảnh minh họa).
 - Bước 5: Trình bày báo cáo trước lớp.
B. Thiết kế mạng LAN
1. Yêu cầu chung
 - Lựa chọn thiết bị mạng và lập sơ đồ kết nối mạng LAN cho một trường phổ thông cỡ nhỏ.
 - Dựa vào sơ đồ mặt bằng và bảng phân bổ thiết bị.
2. Gợi ý và hướng dẫn
 - Bước 1: Phân công nhiệm vụ trong nhóm.
 - Bước 2: Chọn thiết bị mạng cần thiết cho từng khu vực.
 - Bước 3: Vẽ sơ đồ kết nối mạng bằng draw.io.
 - Bước 4: Soạn báo cáo (gồm sơ đồ mặt bằng, bảng thiết bị, sơ đồ kết nối).
 - Bước 5: Trình bày báo cáo trước lớp.
---The End!---
CÙNG CHUYÊN MỤC:
Chủ đề A
Chủ đề B
Chủ đề D
Chủ đề F
Chủ đề G
Chủ đề A (ICT)
Chủ đề E (ICT)
Chủ đề B (CS)
Chủ đề F (CS)
Chủ đề F (CS1)
Chủ đề F (CS1)

CÁC CHUYÊN MỤC LIÊN QUAN:
Kho học liệu tin học 10
Kho học liệu tin học 11
Kho học liệu tin học 12

Tổng số lượt xem

Chăm chỉ chiến thắng tài năng
khi tài năng không chịu chăm chỉ.

- Tim Notke -

Bản quyền
Liên hệ
Chat Zalo
Chat Facebook