
Kỷ nguyên thông tin phát triển rực rỡ như ngày nay là nhờ vào công trình đột phá của một thiên tài đơn độc – Claude Shannon.
Khoa học truy tìm những quy luật cơ bản của tự nhiên. Toán học nghiên cứu và phát hiện những định lý mới. Kỹ thuật xây nên các hệ thống để giải quyết nhu cầu con người. Ba lĩnh vực này phụ thuộc, bổ trợ lẫn nhau nhưng hoàn toàn khác biệt. Thật hiếm có một cá nhân nào lại đồng thời có những đóng góp quan trọng cho cả ba – nhưng Claude Shannon là một ngoại lệ hiếm hoi.
Là người mà triết lý nghiên cứu và làm việc đã truyền cảm hứng cho sự nghiệp của rất nhiều nhà khoa học và các thế hệ sinh viên kỹ thuật, và mới đây là chủ đề của bộ phim tài liệu mang tên The Bit Player, tuy nhiên, cái tên Shannon không hề quen thuộc với công chúng. Ông chưa bao giờ đoạt giải Nobel, và cũng không có tiếng tăm gì nếu so sánh với Albert Einstein hay Richard Feynman, dù trước hay sau khi qua đời vào năm 2001. Nhưng hơn 70 năm trước, trong một bài báo duy nhất mang tính đột phá của thời đại, ông đã đặt nền móng cho toàn bộ cơ sở hạ tầng truyền thông của kỷ nguyên thông tin hiện đại.
Shannon sinh năm 1916 tại Gaylord, Michigan, bố là doanh nhân và mẹ là giáo viên. Sau khi tốt nghiệp Đại học Michigan với chuyên ngành toán học và kỹ thuật điện, ông làm luận văn thạc sỹ tại Viện Công nghệ Massachusetts (MIT), ứng dụng một lĩnh vực toán học gọi là Đại số Bool để phân tích và tổng hợp các mạch chuyển mạch. Đó là một tác phẩm mang tính cách mạng, biến việc thiết kế mạch từ một nghệ thuật trở thành một ngành khoa học, và ngày nay ông được xem là ông tổ của ngành thiết kế mạch kỹ thuật số.
Không dừng lại ở đó, Shannon nâng tầm nhìn vào mục tiêu cao hơn: truyền thông.
Giao tiếp là một trong những nhu cầu cơ bản của con người. Từ tín hiệu khói cho chim bồ câu đưa thư, đến điện thoại rồi truyền hình, con người luôn kiếm tìm các phương thức cho phép liên lạc xa hơn, nhanh hơn và đáng tin cậy hơn. Nhưng kỹ thuật của hệ thống thông tin liên lạc luôn gắn liền với nguồn phát và phương tiện vật lý cụ thể. Shannon tự hỏi: “Có lý thuyết thống nhất nào về thông tin liên lạc không?“. Trong một bức thư năm 1939 gửi cố vấn của mình – Vannevar Bush – Shannon đã phác thảo một số ý tưởng ban đầu về “các tính chất cơ bản chung của hệ thống truyền tải thông tin thông minh”. Sau khi nghiên cứu vấn đề trong cả thập kỷ, Shannon cuối cùng đã xuất bản kiệt tác của mình vào năm 1948: “Một Lý thuyết toán học về Truyền thông”.
Đóng vai trò hạt nhân trong lý thuyết của ông là mô hình giao tiếp chung rất đơn giản: Máy phát mã hóa thông tin thành tín hiệu, tín hiệu này bị suy yếu do nhiễu và sau đó được máy thu giải mã. Mặc dù khá đơn giản, nhưng mô hình của Shannon đã kết hợp hai phát kiến then chốt: thiết kế một hệ thống truyền tin cô lập được riêng rẽ nguồn thông tin và nguồn nhiễu; và mô hình hóa cả hai nguồn này theo lý thuyết xác suất. Ông giả định nguồn phát tạo ra một trong nhiều thông điệp riêng rẽ để truyền đi, mỗi thông điệp đều có một xác suất nhất định. Nguồn nhiễu theo xác suất làm tăng thêm tính ngẫu nhiên cho máy thu trong việc tách rõ tín hiệu.
Trước Shannon, vấn đề thông tin liên lạc chủ yếu được xem như là việc tái tạo các tín hiệu xác định: làm thế nào để biến đổi một tín hiệu nhận được, bị bóp méo bởi môi trường vật lý, và tái tạo lại bản gốc một cách chính xác nhất có thể. Thiên tài của Shannon nằm trong sự quan sát của ông: chìa khóa của giao tiếp chính là sự không chắc chắn. Thì đây, nếu bạn biết trước những gì tôi viết trong bài này, vậy thì tiếp theo tôi sẽ viết gì?

Quan sát của Shannon đã biến truyền thông từ một vấn đề vật lý thành vấn đề trừu tượng, cho phép Shannon lập mô hình xác suất cho sự không chắn chắn của thông tin. Đây là một cú sốc toàn tập đối với các kỹ sư truyền thông thời ấy.
Trong khuôn khổ của sự không chắc chắn và xác suất đó, Shannon đặt ra trong bài báo mang tính bước ngoặt của mình để xác định một cách có hệ thống những giới hạn cơ bản của thông tin liên lạc. Bài báo của ông gồm ba phần. Đóng vai trò trung tâm trong cả ba phần là khái niệm “bit” thông tin, được Shannon sử dụng như đơn vị cơ bản của sự không chắc chắn. Đó là một từ ghép của thuật ngữ “binary digit”, một bit có thể có giá trị 1 hoặc giá trị 0 và Shannon là người đầu tiên sử dụng thuật ngữ này trong bài báo của mình (mặc dù ông cũng cho biết nhà toán học John Tukey đã sử dụng nó trong một bản ghi chép trước đó).
Đầu tiên, Shannon đặt ra công thức cho số lượng bits tối thiểu trên một giây để biểu diễn thông tin, một con số mà ông gọi là tốc độ entropy của thông tin, gọi là H. Con số này là lượng hóa độ không chắc chắn liên quan đến việc xác định thông điệp nào tiếp theo sẽ được nguồn phát ra. Tốc độ entropy càng thấp thì độ không chắc chắn càng ít, và do đó, việc nén thông điệp thành một cái gì đó ngắn hơn sẽ dễ dàng hơn. Ví dụ, nhắn tin với tốc độ 100 ký tự (tiếng Anh) mỗi phút có nghĩa là ta gửi đi một trong số 26^{100} khả năng có thể của tin nhắn mỗi phút, mỗi tin nhắn thể hiện bằng một chuỗi gồm 100 ký tự. Người ta có thể mã hóa toàn bộ các khả năng này thành 470 bits, vì 2^{470} ≈ 26^{100}. Nếu các chuỗi ký tự có khả năng xuất hiện như nhau, thì theo công thức của Shannon, tốc độ entropy là 470bits/m. Trong thực tế, một số chuỗi có nhiều khả năng xuất hiện hơn những chuỗi khác và tốc độ entropy thấp hơn nhiều, cho phép tỷ lệ nén lớn hơn.
Thứ hai, ông đưa ra công thức cho số lượng bits tối đa trên mỗi giây có thể được truyền đi một cách tin cậy trong môi trường có tạp âm, mà ông gọi là dung lượng hệ thống, gọi là C. Đây là tốc độ tối đa mà máy thu có thể xử lý sự không chắc chắn của thông điệp, và nó chính là tốc độ giới hạn của truyền thông.
Cuối cùng, ông chỉ ra rằng cho dù một kênh truyền thông có bị nhiễu âm thế nào đi chăng nữa, cũng vẫn có thể truyền thông tin tin cậy với một tỷ lệ tối đa nhất định qua một kênh truyền, khi và chỉ khi H < C. Như vậy, thông tin cũng giống như nước: Nếu tốc độ của dòng chảy nhỏ hơn dung tích của đường ống, thì dòng chảy qua ống hoàn toàn trơn tru.
Đây là một lý thuyết về truyền thông, đồng thời cũng là lý thuyết về cách thông tin được kết xuất và truyền đưa – một lý thuyết thông tin. Do đó, Shannon còn được xem là “cha đẻ của lý thuyết thông tin“.
Các định lý của ông dẫn đến một số kết luận phản trực quan. Giả sử ta đang nói chuyện ở một nơi rất ồn ào. Cách tốt nhất để đảm bảo thông điệp của ta được nghe rõ là gì? Phải lặp lại nhiều lần? Đó chắc chắn là bản năng đầu tiên của bất kỳ ai đang ở trong một nhà hàng ồn ào, nhưng hóa ra điều đó không hiệu quả lắm. Chắc chắn, càng lặp lại nhiều lần thì nội dung giao tiếp càng đáng tin cậy. Nhưng ta đã hy sinh tốc độ để đạt được độ tin cậy. Shannon đã cho ta thấy rằng vẫn có cách làm tốt hơn. Việc lặp lại tin nhắn là một ví dụ về việc sử dụng mã hóa để truyền tin và bằng cách sử dụng những phương pháp mã hóa khác nhau và phức tạp hơn, người ta có thể giao tiếp nhanh hơn – cho đến khi đạt đến tốc độ giới hạn C – trong khi vẫn duy trì mức độ tin cậy cho phép.
Một kết luận bất ngờ khác xuất phát từ lý thuyết của Shannon là: cho dù bản chất của thông tin là gì – dù đó là bản sonnet của Shakespeare, bản thu âm Fifth Symphony của Beethoven hay một bộ phim của Kurosawa – thì mã hóa thông tin thành từng bit trước khi truyền đi là hiệu quả nhất. Vì vậy, trong một hệ thống vô tuyến, mặc dù cả âm thanh ban đầu và tín hiệu điện từ được truyền đưa qua không gian dưới dạng tín hiệu tương tự (analog), nhưng các định lý của Shannon ngụ ý rằng cách tối ưu là: đầu tiên số hóa sóng âm thanh thành các bits, và sau đó ánh xạ các bits này thành sóng điện từ. Kết quả đáng ngạc nhiên này là nền tảng của thời đại thông tin kỹ thuật số hiện nay, nơi mà bit chiếm vị trí như một vị thần tối cao trong vũ trụ thông tin.
Lý thuyết chung về truyền thông của Shannon tự nhiên như thể ông đã khám phá ra các quy luật giao tiếp của vũ trụ, chứ không phải là phát minh ra chúng. Lý thuyết của ông cũng cơ bản như các quy luật vật lý tự nhiên. Theo nghĩa đó, ông là một nhà khoa học.
Shannon đã phát minh ra mô hình toán học mới để mô tả các quy luật truyền thông. Ông đã đưa ra những khái niệm mới, như tỷ lệ entropy của một mô hình xác suất, đã được áp dụng trong nhánh toán học chuyên sâu như Lý thuyết Ergodic, nghiên cứu các tính chất thống kê của các hệ động lực xác định. Theo nghĩa đó, Shannon là một nhà toán học.
Nhưng trên hết, Shannon là một kỹ sư. Lý thuyết của ông được thúc đẩy bởi các vấn đề kỹ thuật trong thực tế. Và mặc dù nó là lý thuyết bí truyền đối với các kỹ sư thời đó, giờ đây lý thuyết của Shannon đã trở thành khuôn khổ tiêu chuẩn nền tảng cho tất cả các hệ thống thông tin liên lạc hiện đại, thậm chí là truyền thông liên hành tinh. Các nhà khoa học, kỹ sư trên toàn thế giới đang nỗ lực để áp dụng và mở rộng lý thuyết của Shannon vào truyền thông không dây, tăng tốc độ truyền thông lên hai bậc so với thế hệ tiêu chuẩn. Thật vậy, chuẩn 5G hiện đang triển khai không chỉ sử dụng một mà là hai bộ mã hóa, được chứng minh là đạt tới giới hạn tốc độ của Shannon.

Shannon đã phát hiện nền tảng cho tất cả những điều này từ hơn 70 năm trước. Làm sao ông ấy làm được điều đó? Bằng cách tập trung không ngưng nghỉ vào một đặc điểm cốt yếu của vấn đề, và bỏ qua tất cả các khía cạnh khác. Sự đơn giản trong mô hình truyền thông là minh họa đầy đủ cho phong cách này của ông. Ông cũng biết tập trung vào những điều có thể, hơn là chế tạo ngay lập tức một cái gì đó.
Công trình của Shannon minh họa về vai trò thực sự của khoa học chân chính. Khi tôi bắt đầu bậc cao học, cố vấn nói với tôi rằng việc tốt nhất phải làm là cắt tỉa cây tri thức, hơn là thêm hoa lá cành cho nó. Tôi không biết phải làm gì với thông điệp này, tôi từng nghĩ rằng công việc của một nhà nghiên cứu là thêm vào cây tri thức những cành lá của riêng mình. Nhưng qua công việc và nghiên cứu của mình, khi có cơ hội áp dụng triết lý này, tôi đã hiểu ra.
Trước khi Shannon nghiên cứu về truyền thông, các kỹ sư đã có một cái cây kỹ thuật sum suê. Chính công trình hợp nhất của ông đã cắt tỉa, liên kết tất cả những nhánh tri thức này thành một cây thống nhất và đáng yêu – một cái cây sinh hoa kết trái cho rất nhiều thế hệ nhà khoa học, toán học và kỹ sư.
(Nguồn: Quanta Magazine)
1 Response
Mark
September 10, 2022Thanks for your blog, nice to read. Do not stop.