1. Lý thuyết trò chơi

Một trong những công cụ lý thú nhất và thiết thực nhất trong phân tích kinh tế hiện đại là kỹ thuật với tên gọi "lý thuyết trò chơi". Ban đầu lý thuyết trò chơi được áp dụng vào các lĩnh vực như chính trị học và chiến lược quân sự, nhưng phần lớn ứng dụng của nó tỏ ra rất hữu ích trong kinh tế học. Mặc dù quan điểm được Cournot đã dự đoán trước nhưng chính nhà toán học John von Neumann và nhà kinh tế học Oskar Morgenstern là người phát triển lý thuyết chính thức trong The Theory of Games and Economic Behavior, xuất bản năm 1944.

Von Neumann và Morgenstern chỉ rõ độc quyền song mại của Cournot tham gia vào một loại “trò chơi” trong đó mỗi người đều ước đoán độc lập về quyết định đầu ra của nhau. Một người độc quyền song mại ước đoán và nghĩ rằng người kia vẫn luôn giữ đầu ra ở mức không đổi khi đối mặt với điều chỉnh tối đa hóa lợi nhuận trong đầu ra của mình. Dựa vào giả định của Cournot, không có người độc quyền song mại nào biết rằng sự ước đoán này là phi thực tế, vì thế kết quả kình địch là mỗi người bán đều chia phần thị trường như nhau và cùng sản xuất mức đầu ra cân bằng tương đương với 2/3 mức đầu ra lẽ ra phải được sản xuất trong điều kiện đầu ra cạnh tranh. (Thực ra, Cournot khái quát hóa giải pháp sao cho tổng đầu ra trong mô thức của ông luôn bằng n(n + 1) nhân với đầu ra cạnh tranh, trong đó n là số người bán).

2. "Tình trạng khó xử của tù nhân"

Lý thuyết trò chơi sử dụng khái niệm ước đoán hành vi, nhưng không ngây thơ bằng “trò chơi” của Cournot vì lý thuyết xét việc thưởng phạt đi kèm với các ước đoán thay thế. Hãy xét bài toán sau được xem là của nhà toán học A. w. Tucker. Giả sử hai kẻ bắt cóc bị bắt quả tang nhưng Cục điều tra liên bang (FBI) chỉ có chứng cứ chắc chắn để buộc họ tội nhẹ hơn. Trong cố gắng tìm thêm chứng cứ, FBI nhốt riêng tù nhân và ghi lời khai của họ theo cách sau. Mỗi tên bắt cóc được cho biết rằng (1) nếu một người phạm tội, thì người thú nhận mình phạm tội sẽ được trả tự do còn người kia bị tử hình, (2) nếu cả hai không phạm tội, thì cả hai đều nhận hình phạt nhẹ đi cùng với tội phạm ít nghiêm trọng hơn, (3) cả hai đều phạm tội, thì cả hai đều nhận hình phạt nghiêm khắc nhưng không đến nỗi chết. Dựa vào sự thưởng phạt và tính không chắc chắn, giải pháp dự đoán là cả hai đều nhận tội bắt cóc.

Bài toán này nổi tiếng với tên gọi “tình trạng khó xử của tù nhân”, có sự giống nhau trực tiếp trong nhiều loại hành vi kinh tế.

3. Ví dụ các nhà sản xuất ô tô

Hãy xét một hành vi của các nhà sản xuất ô tô - tăng thời gian bảo hành chi phí do nhà sản xuất ô tô mới chịu. Bảo hành là phương pháp sản xuất ô tô mới hấp dẫn người mua nhiều hơn, thường được xem là một loại hành vi độc quyền thiểu số bán. Thế nhưng thời gian bảo hành dài hơn đối với công ty thường tốn kém vì họ tăng phí tổn sản xuất và dễ có khả năng giảm lợi nhuận. Thế nhưng chúng ta thường nhận thấy các nhà sản xuất ô tô mới thường đưa ra nhiều điều khoản bảo hành mới và bao gồm nhiều khoản hơn. Những chế độ bảo hành như thế nằm trong sự tư lợi của nhà sản xuất,và lý thuyết trò chơi sẽ giải thích lý do tại sao.

Hình 22-3 là một ma trận trình bày một tình huống giả thuyết trong đó có hai nhà sản xuất ô tô, Toyota và General Motors đang cố gắng tối đa hóa lợi nhuận. Lợi nhuận thể hiện bằng số đô-la trong mỗi ô. Toyota và General Motors có thể tốT đa hóa lợi nhuận trong ô A nơi không nhà sản xuất nào cung cấp chế độ bảo hành kéo dài. Tổng lợi nhuận công nghiệp 120 triệu đô-la (GM thu được 55 triệu đô-la, Toyota 65 triệu đô-la). Tổng lợi nhuận là 100 triệu đô-la trong các ô B và c và 90 triệu đô-la trong ô D. Thế nhưng hoạt động độc lập, cả hai General Motors và Toyota có thể đạt mức lợi nhuận cao hơn.

General Motors tối đa hóa lợi nhuận trong ô B (70 triệu đô-la) nơi hãng này đưa ra chế độ bảo hành mới trong khi hãng Toyota thì không. Hãy xét tùy chọn của hãng. Bất kể hành vi của Toyota, lợi nhuận của GM vẫn cao hơn khi đưa ra bảo hành kéo dài. Nếu GM đưa ra bảo hành trong khi| Toyota thì không, thì lợi nhuận của GM là 70 triệu đô-la. Nếu GM đưa ra bảo hành và Toyota cũng làm tương tự, thì lợi nhuận của GM sẽ giảm còn| 40 triệu đô-la. Thế nhưng, nếu GM không chọn việc bảo hành và Toyota! cũng thế, thì lợi nhuận của GM giảm còn 30 triệu đô-la. Quản lý Toyota] đánh giá khả năng, sẽ đi đến cùng kết luận, nghĩa là hãng này sẽ luôn khấm khá hơn khi đưa ra chế độ bảo hành. Quyết định độc lập nhằm tối đa hóa lợi nhuận của mỗi hãng sẽ dẫn đến việc đưa ra các chế độ bảo hành. Điều này có nghĩa tổng số lợi nhuận giữa hai hãng sẽ thấp hơn (90 triệu đô-la) mức lẽ ra phải có nếu mỗi hãng không đưa ra chế độ bảo hành (120 triệu đô-la). Nói cách khác, họ là “tù nhân” trong trò chơi.

Trong khi hành vi như thế có thể làm cho người mua ô tô hưởng lợi bằng giá phải trả của những cổ đông hai hãng GM và Toyota, thì bài toán của cổ đông có thể tránh được nếu các nhà sản xuất được phép chia sẻ và đến tận ô A trong Hình 22-3. Chia sẻ trong trường hợp này, cũng như trường hợp khó xử của tù nhân, sẽ tạo ra một giải pháp khác, nhưng sự câu kết như thế thường bị luật chống độc quyền ngăn cấm.

Trong trường hợp đơn giản minh họa trong - Hình 22-3, trò chơi giữa General Mo-tors và Toyota đều có kết quả ổn định, một giải pháp cân bằng. Trong trường hợp đơn giản này, những người tham dự tối thiểu hóa cái tối đa của đối thủ - điều mà von Neumann và Morgenstern gọi là giải pháp tối thiểu cái tối đa. Trò chơi phức tạp hơn - trong đó có nhiều đối thủ và nhiều chiến lược - không hề có kết quả giải pháp cân bằng. Khi xử lý vấn đề tính ổn định cân bằng, von Neumann và Morgenstern giới thiệu khái niệm giá trị: nguyên tắc độ lồi. Độ lồi là một điều kiện cân bằng ổn định trong lý thuyết trò chơi cho phép hai môi quan hệ đồ họa hai chiều được chuyển thành n-không gian Euclide, thúc đẩy phân tích hành vi kinh tế trong các giả định ít chặt chẽ và hạn chế hơn. Một lĩnh vực trong đó kỹ thuật này tạo ra bước đột phá là trong việc cụ thể hóa cái gọi là tâm điểm hệ thống kinh tế, một khái niệm do nhà kinh tế học Tân cổ Điển Francis Y. Edgeworth (1845-1926) nghĩ ra. Trong bối cảnh Edgeworth sử dụng thuật ngữ, “tâm điểm” ám chỉ điều kiện kinh tế của sự trao đổi trong bất kỳ nền kinh tế dựa trên trao đổi.

4. Lịch sử phát triển của lý thuyết trò chơi

Các cuộc thảo luận về toán học của trò chơi đã bắt đầu từ rất lâu trước khi xuất hiện lý thuyết trò chơi toán học hiện đại. Cardano đã viết về trò chơi may rủi trong Liber de ludo aleae ( Sách về trò chơi may rủi ), được viết vào khoảng năm 1564 nhưng được xuất bản sau khi qua đời vào năm 1663. Vào những năm 1650, Pascal và Huygens đã phát triển khái niệm kỳ vọng về lý luận về cấu trúc của trò chơi may rủi, và Huygens đã xuất bản phép tính đánh bạc của mình trong De ratiociniis in ludo aleæ ( Về lý luận trong trò chơi may rủi ) vào năm 1657.

Năm 1713, một lá thư được cho là của Charles Waldegrave đã phân tích một trò chơi có tên là "le Her". Ông là một Jacobite năng động và là chú của James Waldegrave, một nhà ngoại giao người Anh. Trong bức thư này, Waldegrave cung cấp giải pháp chiến lược hỗn hợp minimax cho phiên bản hai người của trò chơi bài le Her và vấn đề hiện được gọi là vấn đề Waldegrave. Trong cuốn Recherches sur les Princecipes mathématiques de la théorie des richesses năm 1838 (Những nghiên cứu về các nguyên tắc toán học của lý thuyết về sự giàu có ), Antoine Augustin Cournot đã coi là một kẻ độc quyền và đưa ra một giải pháp là cân bằng Nash của trò chơi.

Năm 1913, Ernst Zermelo xuất bản Über eine Anwendung der Mengenlehre auf die Theorie des Schachspiels ( Về ứng dụng lý thuyết tập hợp vào lý thuyết trò chơi cờ vua ), chứng minh rằng chiến lược cờ vua tối ưu được xác định một cách nghiêm ngặt. Điều này mở đường cho các định lý tổng quát hơn.

Năm 1938, nhà kinh tế toán học người Đan Mạch Frederik Zeuthen đã chứng minh rằng mô hình toán học có một chiến lược chiến thắng bằng cách sử dụng định lý điểm cố định Brouwer. Trong cuốn sách Applications aux Jeux de Hasard năm 1938 của mình và các ghi chú trước đó, Émile Borel đã chứng minh một định lý minimax cho các trò chơi ma trận tổng bằng không hai người chỉ khi ma trận trả thưởng là đối xứng và cung cấp một giải pháp cho một vô hạn không tầm thường. trò chơi (tên tiếng Anh là Blotto game ). Borel đã phỏng đoán sự không tồn tại của cân bằng chiến lược hỗn hợp trong các trò chơi hữu hạn hai người có tổng bằng 0 , một phỏng đoán đã được von Neumann chứng minh là sai.

5. Bài báo Về lý thuyết trò chơi chiến lược vào năm 1928

Lý thuyết trò chơi không thực sự tồn tại như một lĩnh vực duy nhất cho đến khi John von Neumann xuất bản bài báo Về lý thuyết trò chơi chiến lược vào năm 1928. Chứng minh ban đầu của Von Neumann sử dụng định lý điểm cố định Brouwer về ánh xạ liên tục thành các tập lồi nhỏ gọn đã trở thành một phương pháp tiêu chuẩn trong lý thuyết trò chơi và kinh tế học toán học. Bài báo của ông được tiếp nối bởi cuốn sách Lý thuyết về trò chơi và hành vi kinh tế năm 1944 của ông đồng tác giả với Oskar Morgenstern. Ấn bản thứ hai của cuốn sách này cung cấp một lý thuyết tiên đề về tiện ích, lý thuyết tái sinh Lí thuyết cũ của Daniel Bernoulli về tiện ích (về tiền) như một kỷ luật độc lập. Công trình nghiên cứu lý thuyết trò chơi của Von Neumann đạt đến đỉnh cao trong cuốn sách năm 1944 này. Công trình cơ bản này chứa đựng phương pháp tìm giải pháp phù hợp cho cả hai trò chơi có tổng bằng 0. Công việc tiếp theo chủ yếu tập trung vào lý thuyết trò chơi hợp tác, phân tích các chiến lược tối ưu cho các nhóm cá nhân, giả định rằng họ có thể thực thi các thỏa thuận giữa họ về các chiến lược phù hợp.

Năm 1950, cuộc thảo luận toán học đầu tiên về tình thế tiến thoái lưỡng nan của tù nhân xuất hiện, và một thí nghiệm được thực hiện bởi các nhà toán học nổi tiếng Merrill M. Flood và Melvin Dresher, trong khuôn khổ cuộc điều tra của Tập đoàn RAND về lý thuyết trò chơi. RAND theo đuổi các nghiên cứu vì các ứng dụng khả thi cho chiến lược hạt nhân toàn cầu. Cũng trong khoảng thời gian này, John Nash đã phát triển một tiêu chí cho sự nhất quán lẫn nhau trong chiến lược của người chơi được gọi là cân bằng Nash, áp dụng cho nhiều loại trò chơi hơn so với tiêu chí do von Neumann và Morgenstern đề xuất. Nash đã chứng minh rằng mọi trò chơi không hợp tác với n người chơi hữu hạn, có tổng khác không (không chỉ hai người chơi có tổng bằng 0) đều có cái mà ngày nay được gọi là cân bằng Nash trong các chiến lược hỗn hợp.

Lý thuyết trò chơi trải qua một loạt hoạt động trong những năm 1950, trong đó các khái niệm về cốt lõi, trò chơi dạng mở rộng, trò chơi hư cấu, trò chơi lặp lại và giá trị Shapley được phát triển. Những năm 1950 cũng chứng kiến những ứng dụng đầu tiên của lý thuyết trò chơi vào triết học và khoa học chính trị.

LUẬT MINH KHUÊ (Sưu tầm)