
Anonymous
0
0
Giải Tin học 10 Bài 3 (Kết nối tri thức): Một số kiểu dữ liệu và dữ liệu văn bản
- asked 4 months agoVotes
0Answers
0Views
Giải Tin học lớp 10 Bài 3: Một số kiểu dữ liệu và dữ liệu văn bản
Khởi động
Khởi động trang 16 Tin học 10: Thông tin đưa vào bộ nhớ máy tính dưới dạng các dãy bit. Như vậy, khi đưa vào máy tính phải mã hoá thông tin thành dữ liệu nhị phân. Tuỳ theo bản chất của thông tin được mã hoá mà dữ liệu tương ứng có cách biểu diễn riêng, từ đó hình thành nên các kiểu dữ liệu khác nhau. Vậy, trong máy tính có các kiểu dữ liệu nào?
Trả lời:
Trong máy tính có các kiểu dữ liệu là: dữ liệu số, văn bản, hình ảnh, âm thanh và lôgic.
1. Phân loại và biểu diễn thông tin máy tính
Hoạt động
Hoạt động 1 trang 16 Tin học 10: Phân loại thông tin
Hình 3.1 minh họa một thẻ căn cước công dân. Trên đó có những thông tin gì?
Trả lời:
Hình 3.1 cho biết các thông tin về số căn cước công dân, họ tên, ngày sinh, giới tính, quê quán, nơi thường trú.
+ Nhóm các thông tin có thể tách ghép được hay so sánh được để tìm kiếm: họ tên, giới tính, quê quán, nơi thường trú.
+ Nhóm các thông tin có thể thực hiện được với các phép tính số học là: số căn cước công dân, ngày sinh.
Câu hỏi
Câu hỏi 1 trang 17 Tin học 10: Theo em số căn cước công dân có kiểu số hay kiểu văn bản?
Trả lời:
Số căn cước công dân có kiểu số.
Câu hỏi 2 trang 17 Tin học 10: Kiểu số thực thường dùng để biểu diễn các số có phần thập phân (phần lẻ). Em hãy cho ví dụ một loại hồ sơ có dữ liệu kiểu số thực.
Trả lời:
- Hồ sơ có dữ liệu kiểu số thực ví dụ như hồ sơ về điểm số học sinh.
2. Biểu diễn dữ liệu văn bản
Hoạt động
Hoạt động 2 trang 17 Tin học 10: Bảng kí tự La tinh và bảng kí tự tiếng Việt
1. Bảng kí tự La tinh có những kí tự nào?
2. Trong tin học, mỗi nguyên âm có dấu thanh của tiếng Việt là một kí tự. hãy kể tên các kí tự có trong tiếng Việt không có trong bảng kí tự La tinh. Có bao nhiêu kí tự như vậy?
Trả lời:
1. Gồm tất cả 128 kí tự tiếng Anh.
2.
- Các kí tự có trong tiếng Việt không có trong bảng kí tự La tinh là: Ô, Ư, Ơ, Ă, Â…
- Có 141 nguyên âm có dấu thanh không có trong bảng kí tự La tinh.
Câu hỏi
Câu hỏi 1 trang 18 Tin học 10: Mã nhị phân và mã thập phân của các kí tự S, G, K trong bảng mã ASCII là gì?
Trả lời:
+ Mã nhị phân và mã thập phân của các kí tự S trong bảng mã ASCII lần lượt là: 01010011 và 83.
+ Mã nhị phân và mã thập phân của các kí tự G trong bảng mã ASCII lần lượt là: 01000111 và 71.
+ Mã nhị phân và mã thập phân của các kí tự K trong bảng mã ASCII lần lượt là: 01001011 và 75.
Câu hỏi 2 trang 18 Tin học 10: Trong bảng mã Unicode tiếng Việt, mỗi kí tự được biểu diễn bởi bao nhiêu byte?
Trả lời:
Trong bảng mã Unicode tiếng Việt, mỗi kí tự được biểu diễn từ 1 đến 3 byte.
Luyện tập
Luyện tập 1 trang 19 Tin học 10: Giấy chứng nhận sở hữu xe máy có các thông tin nêu ở cột bên trái bảng sau. Hãy ghép mỗi thông tin ở cột bên trái với dữ liệu thích hợp cột bên phải.
THÔNG TIN |
KIỂU DỮ LIỆU |
Trả lời:
- Kiểu dữ liệu văn bản: Họ và tên, biển số xe
- Kiểu dữ liệu số nguyên: Số căn cước công dân, số khung, số máy, dung tích xy-lanh (cm3).
Luyện tập 2 trang 19 Tin học 10: Câu trả lời nào đúng cho câu hỏi “Tại sao cần có Unicode?”
A. Để đảm bảo bình đẳng cho mọi quốc gia trong ứng dụng tin học.
D. Dùng cho các quốc gia sử dụng chữ tượng hình.
Trả lời:
Đáp án C
Dùng một bảng mã chung cho mọi quốc gia, giải quyết vấn đề thiếu vị trí cho bộ kí tự của một số quốc gia, đáp ứng nhu cầu dùng nhiều ngôn ngữ đồng thời trong cùng một ứng dụng.
Vận dụng
Vận dụng 1 trang 19 Tin học 10: Dự trên bảng mã ASCII, Việt Nam xây dựng bảng mã VSCII (Vietnam Standard Code for Information Interchange), còn gọi là TCVN 5712: 1993. Hãy tìm hiểu bảng mã này trên Internet theo những gợi ý sau:
- Bảng mã có đủ cho tất cả các kí tự tiếng Việt không?
- Bảng mã có bảo toàn bảng mã ASCII 7 bit không?
Trả lời:
- Bảng mã VSCII (TCVN 5712: 1993) là bảng mã đủ cho tất cả kí tự tiếng Việt.
- Bảng mã VSCII (TCVN 5712: 1993) bảo toàn bảng mã ASCII 7 bit.
Vận dụng 2 trang 19 Tin học 10: Có hai bộ gõ tiếng Việt rất thông dụng là UniKey và VietKey. Nếu mở bảng điều khiển của hai phần mềm này ta sẽ thấy rất nhiều bảng mã tiếng Việt trong đó có TCVN3. Em hãy tìm hiểu trên Internet để biết bảng mã TCVN3 là gì?
Trả lời:
Bảng mã TCVN3: Bảng mã theo tiêu chuẩn (cũ) của Việt Nam. Các font chữ trong bảng mã này có tên bắt đầu bằng .Vn và mỗi font có hai loại thường và hoa (font chữ hoa kết thúc bằng H). Ví dụ: .VnTime, .VNSouthernH. Ngày nay TCVN đã quy định sử dụng font Unicode trong soạn thảo văn bản.
Lý thuyết Tin học 10 Bài 3: Một số kiểu dữ liệu và dữ liệu văn bản
1. Phân loại và biểu diễn thông tính trong máy tính
- Biểu diễn thông tin là cách mã hóa thông tin.
- Các kiểu dữ liệu thường gặp là văn bản, số, hình ảnh, âm thanh và lôgic.
- Việc phân loại dữ liệu để có cách biểu diễn phù hợp nhằm tạo điều kiện thuận lợi cho việc xử lí thông tin trong máy tính.
Bảng 1: Sơ đồ phân loại các kiểu dữ liệu
2. Biểu diễn dữ liệu văn bản
a) Bảng mã ASCII
- Ban đầu bảng mã này dùng các mã 7 bit, với 128 mã khác nhau chỉ thể hiện đúng 128 kí tự.
- Bảng mã 7 bit chỉ đủ dùng cho tiếng Anh trong khi nhiều quốc gia dùng kí tự riêng, như Trung Quốc, Hy Lạp, …
⇒ Người ta mở rộng bảng mã 7 bit thành bảng mã 8 bit gọi là ASCII mở rộng cho phép mã hóa 256 kí tự.
b) Bảng mã Unicode và tiếng Việt trong Unicode
- Ngoài các kí tự có trong bảng chữ cái tiếng Anh, Tiếng Việt còn có 134 nguyên âm có dấu thanh và phụ âm “đ” đều không có sẵn trong bảng mã ASCII, trong khi phần mở rộng của bảng mã ASCII lại chỉ có 128 vị trí.
- Tình trạng thiếu vị trí còn trầm trọng hơn với những quốc gia dùng chữ tượng hình như Trung Quốc, Hàn Quốc, …
⇒ Do đó bảng mã Unicode được xây dựng dùng chung cho mọi quốc gia.
- Unicode là một bộ tiêu chuẩn biểu diễn kí tự văn bản trong máy tính, cho phép biểu diễn kí tự thuộc nhiều loại ngôn ngữ khác nhau.
- UTF-8 là hệ thống mã hóa kí tự với độ dài khác nhau dành cho Unicode.
- Từ năm 2017, Việt Nam ban hành quy định bắt buộc sử dụng UTF-8 để biểu diễn các kí tự Tiếng Việt trong máy tính, dùng bảng mã ASCII để mã hóa kí tự latinh không dấu, sử dụng 2 byte để mã hóa các nguyên âm có dấu, các kí tự Đ đ và chỉ dùng 3 byte một số rất ít các kí tự đặc biệt.
c) Số hóa văn bản
- Tệp văn bản là định dạng lưu trữ ở bộ nhớ ngoài.
- Việc số hóa văn bản được thực hiện bằng các phần mềm soạn thảo văn bản như Word, Writer.
- Hiện tại có thể nhập văn bản bằng nhận dạng tiếng nói.