Bài giảng Tin học cơ sở: Bài 1 - Thông tin và xử lý thông tin
Số trang: 19
Loại file: ppt
Dung lượng: 1.08 MB
Lượt xem: 18
Lượt tải: 0
Xem trước 2 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Cùng tìm hiểu khái niệm thông tin và các đặc trưng của thông tin; mã hóa và lượng hóa thông tin; xử lý thông tin bằng máy; khái niệm về tin học và công nghệ thông tin;... được trình bày cụ thể trong "Bài giảng Tin học cơ sở: Bài 1 - Thông tin và xử lý thông tin".
Nội dung trích xuất từ tài liệu:
Bài giảng Tin học cơ sở: Bài 1 - Thông tin và xử lý thông tin ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ BÀI GIẢNG TIN HỌC CƠ SỞ BÀI I. THÔNG TIN VÀ XỬ LÝ THÔNG TIN NỘI DUNG Khái niêm thông tin và các đặc trưng của thông tin Mã hoá và lượng hoá thông tin Xử lý thông tin bằng máy Khái niệm về tin học và công nghệ thông tin Câu hỏi và bài tập THÔNG TIN LÀ GÌ Mùi thức ăn cho biết món gì Báo cho biết tin hàng ngày Thông tin (Information) Lời nói Là tất cả những gì đem lai hiểu biết, Tin tứctrên TV là nguồn gốc của nhận thức Tin tức từ Internet Lưu ý tính mới của thông tin. Giá trị của thông tin không chỉ phụ thuộc vào nội dung mà phụ thuộc cả Một bức tranh vào sự hiểu biết của chủ thể nhận thức. Thông tin có thể vô giá trị nếu đã được biết ĐẶC TRƯNG CỦA THÔNG TIN Dữ liệu là hình thức thể Nơi chứa hiện trong mục đích xử lý Giá mang (support) Tri thức(Knowledge) lưu trữ và truyền tin có tính khái quát hơn Giấy, băng từ, đĩa CD… thông tin. Nó chỉ những nhận thức có được từ nhiều thông tin trong Thông tin một lĩnh vực nào đó có tính hướng mục đích. Tri thức là mục đích Hình thức vật lý của nhận thức Ý nghĩa mà thông tin Tín hiệu (Signal) chuyển tải Âm thanh, hình ảnh, mùi, Ngữ nghĩa (semantic) vị, nhiệt độ… Đặc tính liên tục hay rời rạc – miền giá trị thể hiện của nó là liên tục hay rời rạc (kể ra được) MÃ HOÁ Mã hoá có mục đích biểu diễn các đối tượng mà vẫn phân biệt được đối tượng khác nhau. Đối với thông tin rời rạc luôn có thể mã hoá được Các mã hoá thường dùng là mã hoá trên một tập hợp hữu hạn các kí hiệu (symbol) mà ta gọi là bảng chữ (alphabet). Một từ (word) là một chuỗi hữu hạn các kí hiệu. Để mã hoá, mỗi đối tượng được gán một từ khác nhau. Tính chất này đảm bảo khi biết mã có thể tìm được đối tượng một cách duy nhất. Ví dụ đánh số báo danh các thí sinh của một kỳ thi: bảng chữ là tập các chữ số, mỗi thí sinh được mã hoá bằng một số nhiều chữ số. Đặt tên người không phải là một phép mã hoá vì tính không đơn trị của phép đặt tên Mã hoá là con đường làm dữ liệu MÃ HOÁ NHỊ PHÂN Nếu bộ chữ chỉ có hai ký hiệu thì phép mã hoá trên đó gọi là mã hoá nhị phân. Ví dụ mã Moorse với hai ký hiệu chấm và vạch ___ là mã nhị phân được biết sớm nhất Trong tin học sử dụng bảng chữ nhị phân với hai kí hiệu là {0,1} Nếu sử dụng mã nhị phân có không quá k kí hiệu thì có thể biểu diễn 2k đối tượng khác nhau. Ví dụ với k = 3 có thể có 3 mã 000 001 010 011 100 101 110 111. Ngược lại nếu có n đối tượng thì phải dùng không quá [log2 k] + 1 ký hiệu đê có đủ mã phân biệt các đối tượng Mỗi chữ số nhị phân trong một hệ thống mã nhị phân mang một lượng tin nào đó về đối tượng và được lấy làm đơn vị đo lượng tin. Đơn vị đo lượng tin là bit có nguồn gốc từ Binary DigiT cũng có nghĩa là “chữ số nhị phân” CÁC ĐƠN VỊ ĐO LƯỢNG TIN Đơn vị Viết tắt Lượng tin bít b byte B 8 bít Kilô byte KB 210 B = 1024 B Mega byte MB 210 KB Giga byte GB 210 MB Tera byte TB 210 GB ĐƠN VỊ ĐO LƯỢNG THÔNG TIN Biết thông tin có nghĩa là loại trừ sự “mù mờ”. Có một lượng tin có nghĩa là giảm “độ bất định” hay độ “mù mờ” Trong một không gian các đối tượng, độ mù mờ sẽ tăng nếu số đối tượng nhiều và khả năng xác định của một đối tượng là nhỏ. Khả năng xác định đối tượng đo bằng xác xuất - tỉ lệ xuất hiện của đối tượng. Xác suất của một đối tượng là một con số năm trong khoảng [0,1]. Một đối tượng chắc chắn xuất hiện sẽ có xác xuất là 1 – khi đó nó hoàn toàn xác định. Một đối tượng không bao giờ xuất hiện có xác xuất 0 – nó không xác định. Theo Shannon, độ bất định của một không gian các đối tượng có thể đo được. Nếu không gian đối tượng có n đối tượng A1,A2… An phân biệt có xác xuất lần lượt là p1, p2,…pn ( 0≤p1 ≤1, ∑pi=1) và b là một cơ số (số dương nào đó) nào đó thì độ bất định (entropy) được tính bằng H= - ∑pi logbpi VÍ DỤ TÍNH ĐỘ BẤT ĐỊNH VÀ LƯỢNG TIN Khoa CNTT có 128 cán bộ. Thông tin “một cán bộ nghiên cứu khoa học” rất mù mờ và có độ bất định là: H1 = - ∑pi logbpi = - ∑ (1/128) x (log21/128) = -128 x (1/128) x (-7) = 7 Khi biết thêm tin: cán bộ này làm đang nghiên cứu “quy trình thiết kế phần mềm theo mẫu – pattern design” thì ta biết cán bộ này ở bộ môn công nghệ phần mềm (chỉ có 8 cán bộ). Độ bất định khi này là: H2 = - ∑ (1/8) x (log21/8) = 3 Độ xác định đã tăng nhờ biết thông tin trên. Lượng tin nhận được chính là lượng giảm của độ bất định E= H1-H2 = 4 (bit) LÀM RÕ THÊM ĐƠN VỊ “BIT” Định nghĩa chính xác: bít là lượng tin cần thiết để xác định một đối tượng trong không gian có hai trạng thái đồng xác xuất (1/2). Entropy ban đầu là H1 = - ∑ (1/2) x (log21/2) = 1. Entropy khi hoàn toàn xác định (còn 1 trạng thái với xác xuất 1) H2 = 0. Trong trường hợp có 128 cán bộ, không gian cán bộ ...
Nội dung trích xuất từ tài liệu:
Bài giảng Tin học cơ sở: Bài 1 - Thông tin và xử lý thông tin ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ BÀI GIẢNG TIN HỌC CƠ SỞ BÀI I. THÔNG TIN VÀ XỬ LÝ THÔNG TIN NỘI DUNG Khái niêm thông tin và các đặc trưng của thông tin Mã hoá và lượng hoá thông tin Xử lý thông tin bằng máy Khái niệm về tin học và công nghệ thông tin Câu hỏi và bài tập THÔNG TIN LÀ GÌ Mùi thức ăn cho biết món gì Báo cho biết tin hàng ngày Thông tin (Information) Lời nói Là tất cả những gì đem lai hiểu biết, Tin tứctrên TV là nguồn gốc của nhận thức Tin tức từ Internet Lưu ý tính mới của thông tin. Giá trị của thông tin không chỉ phụ thuộc vào nội dung mà phụ thuộc cả Một bức tranh vào sự hiểu biết của chủ thể nhận thức. Thông tin có thể vô giá trị nếu đã được biết ĐẶC TRƯNG CỦA THÔNG TIN Dữ liệu là hình thức thể Nơi chứa hiện trong mục đích xử lý Giá mang (support) Tri thức(Knowledge) lưu trữ và truyền tin có tính khái quát hơn Giấy, băng từ, đĩa CD… thông tin. Nó chỉ những nhận thức có được từ nhiều thông tin trong Thông tin một lĩnh vực nào đó có tính hướng mục đích. Tri thức là mục đích Hình thức vật lý của nhận thức Ý nghĩa mà thông tin Tín hiệu (Signal) chuyển tải Âm thanh, hình ảnh, mùi, Ngữ nghĩa (semantic) vị, nhiệt độ… Đặc tính liên tục hay rời rạc – miền giá trị thể hiện của nó là liên tục hay rời rạc (kể ra được) MÃ HOÁ Mã hoá có mục đích biểu diễn các đối tượng mà vẫn phân biệt được đối tượng khác nhau. Đối với thông tin rời rạc luôn có thể mã hoá được Các mã hoá thường dùng là mã hoá trên một tập hợp hữu hạn các kí hiệu (symbol) mà ta gọi là bảng chữ (alphabet). Một từ (word) là một chuỗi hữu hạn các kí hiệu. Để mã hoá, mỗi đối tượng được gán một từ khác nhau. Tính chất này đảm bảo khi biết mã có thể tìm được đối tượng một cách duy nhất. Ví dụ đánh số báo danh các thí sinh của một kỳ thi: bảng chữ là tập các chữ số, mỗi thí sinh được mã hoá bằng một số nhiều chữ số. Đặt tên người không phải là một phép mã hoá vì tính không đơn trị của phép đặt tên Mã hoá là con đường làm dữ liệu MÃ HOÁ NHỊ PHÂN Nếu bộ chữ chỉ có hai ký hiệu thì phép mã hoá trên đó gọi là mã hoá nhị phân. Ví dụ mã Moorse với hai ký hiệu chấm và vạch ___ là mã nhị phân được biết sớm nhất Trong tin học sử dụng bảng chữ nhị phân với hai kí hiệu là {0,1} Nếu sử dụng mã nhị phân có không quá k kí hiệu thì có thể biểu diễn 2k đối tượng khác nhau. Ví dụ với k = 3 có thể có 3 mã 000 001 010 011 100 101 110 111. Ngược lại nếu có n đối tượng thì phải dùng không quá [log2 k] + 1 ký hiệu đê có đủ mã phân biệt các đối tượng Mỗi chữ số nhị phân trong một hệ thống mã nhị phân mang một lượng tin nào đó về đối tượng và được lấy làm đơn vị đo lượng tin. Đơn vị đo lượng tin là bit có nguồn gốc từ Binary DigiT cũng có nghĩa là “chữ số nhị phân” CÁC ĐƠN VỊ ĐO LƯỢNG TIN Đơn vị Viết tắt Lượng tin bít b byte B 8 bít Kilô byte KB 210 B = 1024 B Mega byte MB 210 KB Giga byte GB 210 MB Tera byte TB 210 GB ĐƠN VỊ ĐO LƯỢNG THÔNG TIN Biết thông tin có nghĩa là loại trừ sự “mù mờ”. Có một lượng tin có nghĩa là giảm “độ bất định” hay độ “mù mờ” Trong một không gian các đối tượng, độ mù mờ sẽ tăng nếu số đối tượng nhiều và khả năng xác định của một đối tượng là nhỏ. Khả năng xác định đối tượng đo bằng xác xuất - tỉ lệ xuất hiện của đối tượng. Xác suất của một đối tượng là một con số năm trong khoảng [0,1]. Một đối tượng chắc chắn xuất hiện sẽ có xác xuất là 1 – khi đó nó hoàn toàn xác định. Một đối tượng không bao giờ xuất hiện có xác xuất 0 – nó không xác định. Theo Shannon, độ bất định của một không gian các đối tượng có thể đo được. Nếu không gian đối tượng có n đối tượng A1,A2… An phân biệt có xác xuất lần lượt là p1, p2,…pn ( 0≤p1 ≤1, ∑pi=1) và b là một cơ số (số dương nào đó) nào đó thì độ bất định (entropy) được tính bằng H= - ∑pi logbpi VÍ DỤ TÍNH ĐỘ BẤT ĐỊNH VÀ LƯỢNG TIN Khoa CNTT có 128 cán bộ. Thông tin “một cán bộ nghiên cứu khoa học” rất mù mờ và có độ bất định là: H1 = - ∑pi logbpi = - ∑ (1/128) x (log21/128) = -128 x (1/128) x (-7) = 7 Khi biết thêm tin: cán bộ này làm đang nghiên cứu “quy trình thiết kế phần mềm theo mẫu – pattern design” thì ta biết cán bộ này ở bộ môn công nghệ phần mềm (chỉ có 8 cán bộ). Độ bất định khi này là: H2 = - ∑ (1/8) x (log21/8) = 3 Độ xác định đã tăng nhờ biết thông tin trên. Lượng tin nhận được chính là lượng giảm của độ bất định E= H1-H2 = 4 (bit) LÀM RÕ THÊM ĐƠN VỊ “BIT” Định nghĩa chính xác: bít là lượng tin cần thiết để xác định một đối tượng trong không gian có hai trạng thái đồng xác xuất (1/2). Entropy ban đầu là H1 = - ∑ (1/2) x (log21/2) = 1. Entropy khi hoàn toàn xác định (còn 1 trạng thái với xác xuất 1) H2 = 0. Trong trường hợp có 128 cán bộ, không gian cán bộ ...
Tìm kiếm theo từ khóa liên quan:
Bài giảng Tin học cơ sở Tin học cơ sở Xử lý thông tin Đặc trưng của thông tin Xử lý thông tin bằng máy Lượng hóa thông tinTài liệu có liên quan:
-
PHÂN TÍCH THIẾT KẾ HỆ THỐNG XÂY DỰNG HỆ THỐNG ĐẶT VÉ TÀU ONLINE
43 trang 311 2 0 -
Tóm tắt luận án tiến sỹ Một số vấn đề tối ưu hóa và nâng cao hiệu quả trong xử lý thông tin hình ảnh
28 trang 234 0 0 -
6 trang 215 0 0
-
Tài liệu học tập môn Tin cơ sở: Phần 1 - Phùng Thị Thu Hiền
100 trang 207 1 0 -
Giáo trình nhập môn lập trình - Phần 22
48 trang 145 0 0 -
Bài giảng Kỹ thuật xử lý và phân tích số liệu định lượng - ThS, Nguyễn Ngọc Anh
10 trang 128 0 0 -
Luận văn: Các khái niệm công cụ và cách tiếp cận nghiên cứu nguồn nhân lực hành chính nhà nước
220 trang 108 0 0 -
QUY TRÌNH THU THẬP VÀ XỬ LÝ THÔNG TIN PHẢN HỒI KHÁCH HÀNG
3 trang 108 0 0 -
Tiểu Luận Chương Trình Quản Lí Học Phí Trường THPT
18 trang 105 0 0 -
PHÂN TÍCH THIẾT KẾ HỆ THỐNG THÔNG TIN - CHƯƠNG 5 MÔ HÌNH DỮ LIỆU QUAN NIỆM
11 trang 70 0 0