Lý Thuyết Trò Chơi

Lý thuyết trò chơi là "việc nghiên cứu mô hình toán học của xung đột và hợp tác giữa lý trí ra quyết định thông minh." lý thuyết trò chơi được sử dụng chủ yếu trong kinh tế học, chính trị, và tâm lý, cũng như logic, khoa học máy tính, sinh học và Poker ( Texas No Limit Hold'em). Ban đầu, nó giải quyết trò chơi tổng bằng không, trong đó lợi ích của một cá nhân gây ra tổn thất cho những người tham gia khác. Hôm nay, lý thuyết trò chơi áp dụng cho một loạt các quan hệ hành vi, và bây giờ là một thuật ngữ chung cho các khoa học của việc ra quyết định hợp lý trong con người, động vật, và máy tính.

Lý thuyết trò chơi hiện đại bắt đầu với ý tưởng liên quan đến sự tồn tại của hỗn hợp chiến lược cân bằng trong hai người trò chơi tổng bằng không và bằng chứng của nó bởi John von Neumann. Bằng chứng gốc Von Neumann sử dụng Brouwer định lý điểm trên ánh xạ liên tục vào các tập lồi nhỏ gọn, mà đã trở thành một phương pháp chuẩn trong lý thuyết trò chơi và toán kinh tế. Bài viết của ông đã được theo sau bởi năm 1944 cuốn sách Lý thuyết trò chơi và hành vi kinh tế, đồng sáng tác với Oskar Morgenstern, mà coi trò chơi hợp tác của nhiều cầu thủ. Ấn bản thứ hai của cuốn sách này cung cấp một lý thuyết tiên đề của tiện ích dự kiến, trong đó cho phép các nhà thống kê toán học và kinh tế để điều trị ra quyết định không chắc chắn.

Lý thuyết này đã được phát triển rộng rãi trong những năm 1950 bởi nhiều học giả. Lý thuyết trò chơi đã được áp dụng sau này một cách rõ ràng đến sinh học trong năm 1970, mặc dù phát triển tương tự đi lại ít nhất là xa như những năm 1930. Lý thuyết trò chơi đã được công nhận rộng rãi như là một công cụ quan trọng trong nhiều lĩnh vực. Với giải Memorial Nobel trong khoa học kinh tế đi vào trò chơi, nhà lý thuyết Jean Tirole vào năm 2014, mười một trò chơi lý thuyết hiện nay đã giành được giải thưởng Nobel kinh tế. John Maynard Smith đã được trao giải thưởng Crafoord cho ứng dụng của mình của lý thuyết trò chơi đến sinh học.

Nội dung

1 đại diện của các trò chơi

1.1 Mở rộng hình thức

1.2 Hình thức bình thường

1.3 Đặc điểm hình thức chức năng

2 chung và áp dụng sử dụng

2.1 Mô tả và mô hình hóa

2.2 phân tích quy tắc hay quy phạm

2.3 Kinh tế và kinh doanh

2.4 Khoa học chính trị

2.5 Sinh học

Khoa học máy tính và logic 2.6

2.7 Triết học

3 loại game

3.1 Hợp tác xã / Non-hợp tác xã

3.2 đối xứng / bất đối xứng

3.3 Zero-sum / Non-zero-sum

3.4 Simultaneous / Sequential

3.5 Perfect thông tin và thông tin không hoàn hảo

3.6 trò chơi tổ hợp

3.7 trò chơi Infinitely dài

3.8 trò chơi rời rạc và liên tục

3.9 trò chơi Differential

3.10 Nhiều người chơi và trò chơi dân

3.11 kết quả Stochastic (và liên quan đến các lĩnh vực khác)

3.12 Metagames

3.13 Pooling Games

4 Lịch sử

5 Trong văn hóa

Các trò chơi được nghiên cứu trong lý thuyết trò chơi là các đối tượng toán học được xác định rõ. Để được xác định đầy đủ, một trò chơi phải xác định các yếu tố sau: các cầu thủ của trò chơi, những thông tin và hành động có sẵn cho mỗi người chơi tại mỗi điểm quyết định, và sự thưởng phạt cho từng kết quả. (Eric Rasmusen đề cập đến bốn "yếu tố thiết yếu" của các từ viết tắt "PAPI".) [3] Một nhà lý thuyết trò chơi thường sử dụng những yếu tố này, cùng với một khái niệm giải pháp lựa chọn của họ, để suy ra một tập hợp các chiến lược cân bằng cho mỗi cầu thủ như vậy rằng, khi các chiến lược được sử dụng, không có cầu thủ có thể lợi nhuận bằng cách đơn phương sai lệch từ chiến lược của họ. Những chiến lược cân bằng xác định một trạng thái cân bằng với các trò chơi-một trạng thái ổn định, trong đó một trong hai kết quả xảy ra hoặc một loạt các kết quả xảy ra với xác suất đã biết.

Hầu hết các trò chơi hợp tác được trình bày dưới dạng hàm đặc trưng, ​​trong khi mở rộng và các hình thức thông thường được sử dụng để xác định các trò chơi bất hợp tác.

Dạng mở rộng

Bài chi tiết: Mở rộng hình thức trò chơi

Một hình thức trò chơi phong phú

Các dạng mở rộng có thể được sử dụng để hợp thức các trò chơi với một trình tự thời gian của chuyển động. Trò chơi ở đây được chơi trên cây (như trong hình). Ở đây mỗi đỉnh (hoặc nút) đại diện cho một điểm của sự lựa chọn cho một cầu thủ. Các cầu thủ được xác định bởi một số được liệt kê bởi các đỉnh. Các đường ra của đỉnh đại diện cho một hành động có thể cho người chơi đó. Mức thưởng phạt được quy định ở dưới cùng của cây. Các dạng mở rộng có thể được xem như là một sự tổng quát nhiều người chơi của một cây quyết định.

Các trò chơi Trong hình gồm hai người chơi. Cách chơi đặc biệt này được cấu trúc (ví dụ, với việc ra quyết định tuần tự và thông tin hoàn hảo), Player 1 "di chuyển" đầu tiên bằng cách chọn một trong hai F hoặc U (chữ cái được phân công tùy tiện cho mục đích toán học). Tiếp theo trong trình tự, Thủ 2, người bây giờ đã nhìn thấy động thái của Player 1, lựa chọn để chơi hoặc là A hoặc R. Một khi cầu thủ 2 đã thực hiện / sự lựa chọn của mình, trận đấu được coi là hoàn thành và mỗi người chơi nhận được phần thưởng tương ứng của họ. Giả sử rằng Player 1 chọn U và sau đó cầu thủ 2 chọn A: Player 1 sau đó nhận được một phần thưởng của "tám" (mà trong thực tế các điều khoản có thể được giải thích theo nhiều cách, đơn giản nhất trong số đó là về mặt tiền bạc nhưng có thể có nghĩa là mọi thứ như tám ngày của kỳ nghỉ hoặc tám nước chinh phục hoặc thậm chí nhiều hơn tám cơ hội để chơi các trò chơi cùng với các người chơi khác) và 2 cầu thủ nhận được một phần thưởng của "hai".

Các hình thức phong phú, cũng có thể chụp trò chơi đồng thời-thái và các trò chơi với các thông tin không hoàn hảo. Để đại diện cho nó, hoặc là một đường chấm chấm nối đỉnh khác nhau để đại diện cho họ như là một phần của cùng một thông tin thiết lập (tức là các cầu thủ không biết lúc đó họ đang có), hoặc một dây chuyền khép kín được vẽ xung quanh họ. (Xem ví dụ trong phần thông tin không hoàn hảo.)

Hình thức bình thường

Cầu thủ 2

chọn Left Thủ 2

chọn Right

Player 1

chọn Up 4, 3 -1, -1

Player 1

chọn xuống 0, 0 3, 4

Bình thường dưới hình thức thưởng phạt hay ma trận của một 2-player, trò chơi 2 chiến lược

The (hình thức này hay chiến lược) bình thường trò chơi thường được biểu diễn bằng một ma trận trong đó cho thấy các cầu thủ, chiến lược, và thưởng phạt (xem ví dụ bên phải). Nói chung nó có thể được đại diện bởi bất kỳ chức năng liên kết một phần thưởng cho mỗi cầu thủ với mọi sự kết hợp có thể có của các hành động. Trong các ví dụ kèm theo đó là hai cầu thủ; người ta chọn các hàng và các cột khác chọn. Mỗi người chơi có hai chiến lược, được chỉ định bởi số hàng và số cột. Mức thưởng phạt được quy định trong nội thất. Số đầu tiên là phần thưởng nhận được bởi người chơi hàng (Player 1 trong ví dụ của chúng tôi); thứ hai là phần thưởng cho các cầu thủ cột (Player 2 trong ví dụ của chúng tôi). Giả sử rằng Player 1 lượt Up và Thủ 2 lượt trái. Sau đó, 1 cầu thủ nhận được một phần thưởng của 4, và cầu thủ 2 được 3.

Khi một trò chơi được trình bày trong hình thức bình thường, nó được coi như là mỗi người chơi hoạt động đồng thời hoặc, ít nhất, mà không cần biết những hành động của người kia. Nếu người chơi có một số thông tin về những sự lựa chọn của người chơi khác, trò chơi được thường được trình bày ở dạng mở rộng.

Mỗi trò chơi phong phú, hình thức bình thường có dạng trò chơi tương đương, tuy nhiên việc chuyển đổi sang hình thức bình thường có thể dẫn đến một Blowup mũ trong kích thước của các đại diện, làm cho nó tính toán thực tế.

Dạng hàm đặc trưng

Trong trò chơi mà có tiện ích di động, phần thưởng riêng biệt không được đưa ra; đúng hơn, hàm đặc trưng quyết định tiền chi trả của từng đơn vị. Ý tưởng là sự hiệp nhất đó là 'trống rỗng', do đó, để nói chuyện, không nhận được một phần thưởng nào cả.

Nguồn gốc của mẫu này là để được tìm thấy trong John von Neumann và Oskar Morgenstern của cuốn sách; khi nhìn vào những trường hợp này, họ đoán rằng khi một đoàn \ mathbf {C} xuất hiện, nó hoạt động chống lại các phần \ trái ({\ frac {\ mathbf {N}} {\ mathbf {C}}} \ right) như thể hai cá nhân đang chơi một trò chơi bình thường. Việc hoàn trả cân bằng của C là một chức năng cơ bản. Mặc dù có những ví dụ khác nhau giúp xác định các khoản coalitional từ các trò chơi bình thường, không phải tất cả xuất hiện trong hình thức chức năng của họ có thể được bắt nguồn từ đó.

Chính thức, một chức năng đặc trưng được coi là: (N, v), trong đó N đại diện cho các nhóm người và v: 2 ^ {N} \ to \ mathbf {R} là một tiện ích bình thường.

Chức năng đặc trưng như đã mở rộng để mô tả các trò chơi mà không có tiện ích di động.

Nói chung và sử dụng ứng dụng

Là một phương pháp toán học ứng dụng, lý thuyết trò chơi đã được sử dụng để nghiên cứu một loạt các hành vi của con người và động vật. Ban đầu nó được phát triển về kinh tế để hiểu được một bộ sưu tập lớn của các hành vi kinh tế, bao gồm cả hành vi của các doanh nghiệp, thị trường và người tiêu dùng. Việc sử dụng đầu tiên của phân tích lý thuyết trò chơi là bởi Antoine Augustin Cournot năm 1838 với giải pháp của ông về lưỡng quyền Cournot. Việc sử dụng của lý thuyết trò chơi trong các ngành khoa học xã hội đã mở rộng, và lý thuyết trò chơi đã được áp dụng cho các hành vi chính trị, xã hội và tâm lý.

Mặc dù các nhà tự nhiên thế kỷ trước XX như Charles Darwin đã loại báo cáo lý thuyết trò chơi, việc sử dụng các phân tích lý thuyết trò chơi trong sinh học bắt đầu với nghiên cứu Ronald Fisher của hành vi động vật trong những năm 1930. Công việc này xảy ra trước cái tên "lý thuyết trò chơi", nhưng nó chia sẻ nhiều tính năng quan trọng với lĩnh vực này. Sự phát triển kinh tế sau đó đã được áp dụng cho sinh học chủ yếu bởi John Maynard Smith trong cuốn sách của ông Evolution và Lý thuyết trò chơi. [Cần dẫn nguồn]

Ngoài việc được sử dụng để mô tả, dự đoán, và giải thích hành vi, lý thuyết trò chơi cũng đã được sử dụng để phát triển các lý thuyết về hành vi đạo đức hay quy phạm và quy định các hành vi như vậy [6]. Trong kinh tế học và triết học, các học giả đã áp dụng lý thuyết trò chơi để giúp đỡ trong sự hiểu biết về hành vi tốt hoặc thích hợp. Lập luận lý thuyết trò chơi loại này có thể được tìm thấy như xa trở lại như Plato.

Mô tả và mô hình hóa

Một con rết trò chơi bốn giai đoạn.

Việc sử dụng chính của lý thuyết trò chơi là để mô tả và mô hình như thế nào quần thể con người cư xử. Một số [ai?] Học giả tin rằng bằng cách tìm các điểm cân bằng của trò chơi mà họ có thể dự đoán dân số con người thực tế sẽ hành xử khi phải đối mặt với những tình huống tương tự như các trò chơi đang được nghiên cứu. Xem cụ thể này của lý thuyết trò chơi đã bị chỉ trích. Đầu tiên, nó lập luận rằng các giả định được thực hiện bởi các nhà lý thuyết trò chơi thường bị vi phạm khi áp dụng vào tình huống thực tế. Lý thuyết trò chơi thường giả chơi hành động hợp lý, nhưng trong thực tế, hành vi con người thường lệch khỏi mô hình này. Lý thuyết trò chơi phản ứng bằng cách so sánh các giả định của họ cho những người sử dụng trong vật lý. Như vậy, trong khi các giả định của họ không luôn luôn nắm giữ, họ có thể đối xử với lý thuyết trò chơi như một lý tưởng khoa học hợp lý giống như các mô hình được sử dụng bởi các nhà vật lý. Tuy nhiên, việc thực nghiệm đã chỉ ra rằng trong một số trò chơi cổ điển, chẳng hạn như các trò chơi rết, đoán 2/3 của trò chơi trung bình, và các trò chơi độc tài, những người thường xuyên không chơi cân bằng Nash. Có một cuộc tranh luận về tầm quan trọng của những thí nghiệm và cho dù các phân tích của các thí nghiệm nắm được toàn tất cả các khía cạnh của tình hình có liên quan.

Một số lý thuyết trò chơi, sau công việc của John Maynard Smith và George R. Giá, đã quay lại với lý thuyết trò chơi tiến hóa để giải quyết những vấn đề này. Những mô hình giả hoặc không có hợp lý hay hợp lý bị chặn trên một phần của các cầu thủ. Mặc dù cái tên, lý thuyết trò chơi tiến hóa không nhất thiết phải giả chọn lọc tự nhiên trong ý nghĩa sinh học. Lý thuyết trò chơi tiến hóa bao gồm cả mô hình sinh học cũng như sự phát triển văn hóa và cũng học tập cá nhân (ví dụ, động lực chơi hư cấu).

Phân tích quy tắc hay quy phạm

Hợp tác Defect

Hợp tác -1, -1 -10, 0

Defect 0, -10 -5, -5

Tiến thoái lưỡng nan của tù nhân

Một số học giả, như Leonard Savage, [cần dẫn nguồn] thấy lý thuyết trò chơi không phải là một công cụ tiên đoán về hành vi của con người, nhưng là một gợi ý cho người ta nên làm thế nào để cư xử. Kể từ khi một chiến lược, tương ứng với một trạng thái cân bằng Nash của một trò chơi tạo thành phản ứng tốt nhất của một người với hành động của các cầu thủ khác - cung cấp họ đang có trong (giống nhau) cân bằng Nash - chơi một chiến lược mà là một phần của một trạng thái cân bằng Nash có vẻ thích hợp. Điều này sử dụng chuẩn của lý thuyết trò chơi cũng đã bị chỉ trích.

Kinh tế và kinh doanh

Lý thuyết trò chơi là một phương pháp chính được sử dụng trong toán kinh tế và kinh doanh cho các mô hình hành vi của các đại lý tương tác cạnh tranh. Ứng dụng bao gồm một loạt các hiện tượng kinh tế và phương pháp tiếp cận, chẳng hạn như đấu giá, mặc cả, sáp nhập và mua lại giá cả, phân chia công bằng , duopolies, oligopolies, hình thành mạng xã hội, kinh tế tính toán đại lý dựa trên, cân bằng tổng thể, thiết kế cơ chế, và hệ thống bầu cử; và trên khu vực rộng lớn như kinh tế thực nghiệm, hành vi kinh tế, thông tin kinh tế, tổ chức công nghiệp, và kinh tế chính trị.

Nghiên cứu này thường tập trung vào bộ cụ thể của chiến lược gọi là "khái niệm giải pháp" hay "cân bằng". Một giả định phổ biến là người chơi có hành động hợp lý. Trong trò chơi không hợp tác, nổi tiếng nhất trong số này là cân bằng Nash. Một tập hợp các chiến lược là một trạng thái cân bằng Nash nếu mỗi đại diện cho một phản ứng tốt nhất với các chiến lược khác. Nếu tất cả các cầu thủ đang chơi các chiến lược trong một trạng thái cân bằng Nash, họ không có động đơn phương để đi chệch, kể từ khi chiến lược của họ là tốt nhất họ có thể làm được những gì người khác đang làm.

Mức thưởng phạt của trò chơi này thường được thực hiện để đại diện cho các tiện ích của cá nhân cầu thủ.

Một bài báo nguyên mẫu về lý thuyết trò chơi trong kinh tế bắt đầu bằng cách trình bày một trò chơi mà là một khái niệm trừu tượng của một tình hình kinh tế cụ thể. Một hoặc nhiều khái niệm giải pháp được lựa chọn, và các tác giả thể hiện trong đó bộ chiến lược trong các trò chơi được trình bày là điểm cân bằng của các loại thích hợp. Đương nhiên người ta có thể tự hỏi những gì sử dụng thông tin này nên được đặt. Các nhà kinh tế và các giáo sư kinh doanh đề nghị hai cấp sử dụng (đã nói ở trên). Mô tả và quy tắc

Khoa học chính trị

Các ứng dụng của lý thuyết trò chơi để khoa học chính trị tập trung tại các khu vực chồng lấn các bộ phận công bằng, kinh tế chính trị, lựa chọn công cộng, cuộc chiến tranh thương lượng, thuyết chính trị tích cực, và lý thuyết lựa chọn xã hội. Trong mỗi lĩnh vực này, các nhà nghiên cứu đã phát triển các mô hình lý thuyết trò chơi mà trong đó các cầu thủ thường cử tri, các quốc gia, các nhóm lợi ích đặc biệt, và các chính trị gia.

Ví dụ đầu của lý thuyết trò chơi áp dụng cho khoa học chính trị được cung cấp bởi Anthony Downs. Trong cuốn sách của ông An Lý thuyết kinh tế của nền dân chủ, ông áp dụng các mô hình Hotelling vị trí vững chắc cho quá trình chính trị. Trong mô hình Downsian, ứng cử viên chính trị cam kết tư tưởng về một không gian chính sách một chiều. Downs đầu tiên cho thấy làm thế nào các ứng cử viên chính trị sẽ hội tụ với các hệ tư tưởng ưa thích bởi các cử tri trung nếu các cử tri được thông báo đầy đủ, nhưng sau đó lập luận rằng các cử tri lựa chọn hợp lý vẫn không biết gì mà cho phép cho ứng cử viên phân kỳ.

Nó cũng đã được đề xuất rằng lý thuyết trò chơi giải thích sự ổn định của bất kỳ hình thức chính quyền chính trị. Lấy trường hợp đơn giản nhất của một chế độ quân chủ, ví dụ, các vua, là chỉ có một người, không và không thể duy trì quyền lực của mình bằng cách tiếp thực kiểm soát vật lý trên tất cả hoặc thậm chí bất kỳ số lượng đáng kể các đối tượng của mình. Kiểm Sovereign là thay vì giải thích bằng sự công nhận của mỗi người dân mà tất cả các công dân khác mong đợi nhau để xem các vua (hay chính phủ thành lập khác) là người có đơn đặt hàng sẽ được theo sau. Phối hợp thông tin liên lạc giữa các công dân để thay thế chủ quyền bị cấm có hiệu quả, vì âm mưu để thay thế chủ quyền thường bị trừng phạt như một tội phạm. Như vậy, trong quá trình đó có thể được mô hình hóa bởi các biến thể của tiến thoái lưỡng nan của tù nhân, trong thời kỳ ổn định không có công dân sẽ tìm thấy nó hợp lý để di chuyển để thay thế chủ quyền, ngay cả khi tất cả các công dân biết rằng họ sẽ tốt hơn nếu họ là tất cả các hành động chung.

Một lời giải thích lý thuyết trò chơi cho hòa bình dân chủ là cuộc tranh luận công khai và mở trong các nền dân chủ gửi thông tin rõ ràng và đáng tin cậy về ý định của họ để các tiểu bang khác. Ngược lại, rất khó để biết những ý định của các nhà lãnh đạo phi dân chủ, những nhượng bộ có hiệu lực sẽ có, và nếu lời hứa sẽ được giữ lại. Như vậy sẽ có sự hồ nghi và không sẵn lòng nhượng bộ nếu ít nhất một trong các bên trong tranh chấp là một phi dân chủ.

Lý thuyết trò chơi cũng có thể giúp dự đoán phản ứng của một quốc gia khi có một quy tắc mới hoặc pháp luật được áp dụng cho quốc gia đó. Một ví dụ sẽ là (2013) nghiên cứu Peter John Wood khi anh nhìn vào những gì các quốc gia có thể làm gì để giúp làm giảm biến đổi khí hậu. Gỗ nghĩ này có thể được thực hiện bằng cách làm cho các hiệp ước với các nước khác để giảm phát thải khí nhà kính. Tuy nhiên, ông kết luận rằng ý tưởng này không thể làm việc vì nó sẽ tạo tiến thoái lưỡng nan của một tù nhân của các nước.

Môn sinh học

Hawk Dove

Hawk 20, 20 80, 40

Dove 40, 80 60, 60

Các trò chơi hawk-chim bồ câu

Không giống như những người trong kinh tế học, các phần thưởng cho các trò chơi trong sinh học thường được hiểu là tương ứng với tập thể dục. Ngoài ra, trọng tâm đã được ít về cân bằng tương ứng với một khái niệm về tính hợp lý và nhiều hơn nữa về những người mà có thể được duy trì bởi các lực lượng tiến hóa. Các trạng thái cân bằng tốt nhất được biết trong sinh học được biết đến như là chiến lược tiến hóa ổn định (ESS), lần đầu tiên được giới thiệu trong (Smith & Giá 1973). Mặc dù động lực ban đầu của nó không liên quan đến bất kỳ yêu cầu tinh thần của trạng thái cân bằng Nash, mỗi ESS là một trạng thái cân bằng Nash.

Trong sinh học, lý thuyết trò chơi đã được sử dụng như là một mô hình để hiểu được nhiều hiện tượng khác nhau. Nó lần đầu tiên được sử dụng để giải thích sự tiến hóa (và ổn định) của 1 gần đúng: 1 tỷ lệ giới tính. (Fisher 1930) gợi ý rằng 1: tỷ lệ giới tính 1 là kết quả của các lực lượng tiến hóa tác động lên các cá nhân có thể được xem như là cố gắng để tối đa hóa số lượng của họ của cháu.

Ngoài ra, các nhà sinh học đã sử dụng lý thuyết trò chơi tiến hóa và ESS để giải thích sự xuất hiện của giao tiếp động vật. [25] Các phân tích của các trò chơi và trò chơi truyền tín hiệu thông tin liên lạc khác đã cung cấp cái nhìn sâu sắc vào sự phát triển của truyền thông giữa các loài động vật. Ví dụ, các hành vi đi train của nhiều loài, trong đó một số lượng lớn các loài động vật săn mồi tấn công một động vật ăn thịt lớn, có vẻ là một ví dụ về tổ chức cấp cứu tự phát. Kiến cũng đã được hiển thị để thể hiện hành vi feed-forward giống như thời trang (xem bướm Kinh tế Paul Ormerod của).

Các nhà sinh học đã sử dụng các trò chơi gà để phân tích chiến đấu và hành vi lãnh thổ.

Theo Maynard Smith, trong lời nói đầu Evolution và Lý thuyết trò chơi, "nghịch lý, nó đã bật ra rằng lý thuyết trò chơi được dễ dàng hơn để áp dụng sinh học hơn đến lĩnh vực hoạt động kinh tế mà nó được thiết kế ban đầu". Lý thuyết trò chơi tiến hóa đã được sử dụng để giải thích nhiều hiện tượng dường như không thích hợp trong tự nhiên.

Một trong những hiện tượng được gọi là lòng vị tha sinh học. Đây là một tình huống trong đó một sinh vật xuất hiện để hành động một cách có lợi sinh vật khác và gây bất lợi cho bản thân. Đây là khác biệt với quan niệm truyền thống của lòng vị tha vì hành động như vậy là không có ý thức, nhưng có vẻ là sự thích nghi tiến hóa để tăng thể lực tổng thể. Ví dụ có thể được tìm thấy ở các loài khác nhau, từ những con dơi ma cà rồng mà nôn ra máu họ đã thu được từ săn bắn của một đêm và cung cấp cho nó để thành viên trong nhóm đã không ăn, để con ong thợ chăm sóc cho các con ong nữ hoàng cho toàn bộ cuộc sống của họ và không bao giờ giao phối, để khỉ vervet đó cảnh báo các thành viên nhóm các phương pháp tiếp cận của một động vật ăn thịt, ngay cả khi nó gây nguy hiểm cho cơ hội của cá nhân đó sống sót. [28] Tất cả những hành động này làm tăng thể lực tổng thể của một nhóm, nhưng xảy ra tại một chi phí cho cá nhân.

Lý thuyết trò chơi tiến hóa giải thích lòng vị tha này với ý tưởng chọn lựa họ hàng. Altruists phân biệt đối xử giữa các cá nhân họ giúp đỡ và người thân ủng hộ. Quy tắc của Hamilton giải thích lý do đằng sau tiến hóa lựa chọn này với các phương trình c <b * r nơi mà chi phí (c) đến vị tha phải nhỏ hơn phúc lợi (b) cho người nhận nhân với hệ số của các mối quan (r). Các chặt chẽ hơn liên quan đến hai sinh vật là nguyên nhân tỷ lệ mắc của lòng vị tha để tăng bởi vì họ chia sẻ nhiều alen giống nhau. Điều này có nghĩa rằng các cá nhân vị tha, bằng cách bảo đảm rằng các alen của họ hàng gần gũi của nó được thông qua ngày, (thông qua sự tồn tại của con cái của nó) có thể từ bỏ các tùy chọn của việc có con cái riêng của mình vì cùng số alen được thông qua ngày. Giúp một gia đình trong ví dụ (ở động vật lưỡng bội), có hệ số ½, vì (trung bình) một cổ phiếu riêng lẻ ½ của các alen trong con người anh em của hãng. Đảm bảo rằng đủ của con một của anh chị em sống sót đến tuổi trưởng thành này loại bỏ sự cần thiết của cá nhân vị tha sản xuất con. Các giá trị hệ số phụ thuộc rất nhiều vào phạm vi của sân chơi. ví dụ nếu việc lựa chọn ai để ủng hộ bao gồm tất cả các sinh vật sống di truyền, không chỉ tất cả người thân, chúng ta giả định sự khác nhau giữa tất cả mọi người chỉ chiếm khoảng 1% của sự đa dạng trong các sân chơi, một đồng tác hiệu quả đó là ½ trong lĩnh vực nhỏ hơn trở thành 0,995. Tương tự như vậy, nếu xét thấy các thông tin khác hơn là của một bản chất di truyền (ví dụ như biểu sinh học, tôn giáo, khoa học, vv) vẫn kiên trì thông qua thời gian các sân chơi trở nên lớn hơn vẫn còn, và các sai lệch nhỏ hơn.

Khoa học máy tính và logic

Lý thuyết trò chơi đã dần đóng một vai trò ngày càng quan trọng trong logic và khoa học máy tính. Một số giả thuyết hợp lý có cơ sở ngữ nghĩa trong game. Ngoài ra, các nhà khoa học máy tính đã sử dụng trò chơi để mô hình tính toán tương tác. Ngoài ra, lý thuyết trò chơi cung cấp một cơ sở lý thuyết cho các lĩnh vực của hệ thống đa agent.

Riêng biệt, lý thuyết trò chơi đã đóng một vai trò trong các thuật toán trực tuyến. Đặc biệt, vấn đề k-server, trong đó có trong quá khứ được gọi là trò chơi với việc di chuyển các chi phí và các trò chơi yêu cầu trả lời. Nguyên tắc của Yao là một kỹ thuật lý thuyết trò chơi để chứng minh giới hạn thấp hơn trên các tính toán phức tạp của thuật toán ngẫu nhiên , thuật toán đặc biệt là trực tuyến.

Sự xuất hiện của Internet đã thúc đẩy sự phát triển của các thuật toán cho việc tìm kiếm điểm cân bằng trong trò chơi, thị trường, đấu giá tính toán, peer-to-peer hệ thống, và các thị trường an ninh thông tin. Thuật toán lý thuyết trò chơi [30] và bên trong nó là thiết kế thuật toán kết hợp thiết kế thuật toán tính toán và phân tích các hệ thống phức tạp với lý thuyết kinh tế.

Triết lý

Stag Hare

Stag 3, 3 0, 2

Hare 2, 0 2, 2

Stag săn

Lý thuyết trò chơi đã được đưa vào sử dụng nhiều trong triết học. Đối phó với hai bài báo của W.V.O. Quine (1960, 1967), Lewis (1969) đã sử dụng lý thuyết trò chơi để phát triển một tài khoản triết học của công ước. Khi làm như vậy, ông đã cung cấp những phân tích đầu tiên của kiến ​​thức phổ biến và sử dụng nó trong việc phân tích chơi trong các trò chơi phối hợp. Ngoài ra, lần đầu tiên ông đề nghị rằng người ta có thể hiểu được ý nghĩa về mặt trận báo hiệu. Đề nghị này sau đó đã được theo đuổi bởi một số nhà triết học từ Lewis. [33] lý thuyết Sau Lewis tài khoản (1969) lý thuyết trò chơi của công ước, Edna Ullmann-Margalit (1977) và Bicchieri (2006) đã phát triển các chuẩn mực xã hội mà coi họ như Nash điểm cân bằng là kết quả từ việc chuyển đổi một trò chơi hỗn hợp động cơ thành một trò chơi phối hợp.

Lý thuyết trò chơi cũng đã thách thức các nhà triết học để suy nghĩ về nhận thức luận tương tác: những gì nó có nghĩa là cho một tập thể để có niềm tin hay kiến ​​thức chung, và những hậu quả của kiến ​​thức này cho kết quả xã hội do sự tương tác của các đại lý là gì. Các triết gia đã từng làm việc trong lĩnh vực này bao gồm Bicchieri (1989, 1993), [36] [37] Skyrms (1990), [38] và Stalnaker (1999).

Trong đạo đức, một số [ai?] Tác giả đã cố gắng để theo đuổi dự án bắt nguồn từ đạo đức tư lợi Thomas Hobbes. Kể từ khi trò chơi như tiến thoái lưỡng nan của tù nhân trình bày một cuộc xung đột rõ ràng giữa đạo đức và tư lợi, giải thích tại sao sự hợp tác là yêu cầu của tư lợi là một thành phần quan trọng của dự án này. Chiến lược chung này là một phần của quan điểm hợp đồng xã hội chung trong triết học chính trị (ví dụ, xem Gauthier (1986) và Kavka (1986)).

Các tác giả khác đã cố gắng sử dụng lý thuyết trò chơi tiến hóa để giải thích sự xuất hiện của thái độ của con người về đạo đức và hành vi động vật tương ứng. Các tác giả này nhìn vào một số trò chơi bao gồm tiến thoái lưỡng nan của người tù, hươu săn, và mặc cả trò chơi Nash như cung cấp một lời giải thích cho sự xuất hiện của thái độ về đạo đức (xem, ví dụ, Skyrms (1996, 2004) và Sober và Wilson (1999)).

Các loại trò chơi

Một trò chơi là hợp tác xã nếu các cầu thủ có thể hình thành các cam kết ràng buộc. Ví dụ, hệ thống pháp luật đòi hỏi họ phải tuân thủ lời hứa của họ. Trong trò chơi bất hợp tác, điều này là không thể.

Thường thì người ta cho rằng truyền thông giữa các cầu thủ được cho phép trong trò chơi hợp tác, nhưng không phải ở những người không hợp tác. Tuy nhiên, việc phân loại này trên hai tiêu chí nhị phân đã được đặt câu hỏi, và đôi khi bị từ chối.

Trong hai loại trò chơi, trò chơi không hợp tác có thể để mô hình tình huống để các chi tiết nhỏ nhất, sản xuất kết quả chính xác. Trò chơi hợp tác tập trung vào các trò chơi tại lớn. Những nỗ lực đáng kể đã được thực hiện để liên kết hai cách tiếp cận. Cái gọi là Nash-chương trình (chương trình Nash là chương trình nghiên cứu để điều tra về các giải pháp một mặt mặc cả tiên đề và mặt khác kết quả cân bằng của các thủ tục thương lượng chiến lược) đã xây dựng những giải pháp hợp tác xã là điểm cân bằng bất hợp tác .

Trò chơi lai chứa các yếu tố hợp tác xã và không hợp tác. Ví dụ, các liên minh của các cầu thủ được hình thành trong một trò chơi hợp tác, nhưng những đóng trong một thời trang không hợp tác.

Đối xứng / bất đối xứng

E F

E 1, 2 0, 0

F 0, 0 1, 2

Một trò chơi không đối xứng

Một trò chơi đối xứng là một trò chơi, nơi các phần thưởng cho chơi một chiến lược cụ thể chỉ phụ thuộc vào các chiến lược khác làm việc, không phải trên những người đang chơi cho họ. Nếu nhận dạng của các cầu thủ có thể được thay đổi mà không cần thay đổi phần thưởng cho các chiến lược, sau đó là một trò chơi đối xứng. Nhiều người trong số 2 × 2 trò chơi thường được nghiên cứu là đối xứng. Cơ quan đại diện tiêu chuẩn của gà, tiến thoái lưỡng nan của tù nhân, và săn hươu là tất cả các trò chơi đối xứng. Một số [ai?] Các học giả sẽ xem xét một số trò chơi không đối xứng như các ví dụ về các trò chơi là tốt. Tuy nhiên, sự thưởng phạt phổ biến nhất đối với mỗi một trò chơi là đối xứng.

Thường được nghiên cứu nhiều nhất trò chơi bất đối xứng là trò chơi mà không có bộ chiến lược giống nhau cho cả hai người chơi. Ví dụ, các trò chơi tối hậu và tương tự những trò chơi độc tài có những chiến lược khác nhau cho mỗi người chơi. Nó là có thể, tuy nhiên, đối với một trò chơi để có chiến lược giống nhau cho cả hai người chơi, chưa có bất đối xứng. Ví dụ, các trò chơi trong hình bên phải là bất đối xứng mặc dù có bộ chiến lược giống nhau cho cả hai người chơi.

Zero-sum / Non-zero-sum

A B

A -1, 1 3, -3

B 0, 0 -2, 2

Một trò chơi có tổng bằng không

Trò chơi có tổng bằng không là một trường hợp đặc biệt của trò chơi không đổi tiền, trong đó sự lựa chọn của người chơi có thể không tăng cũng không giảm nguồn lực sẵn có. Trong trò chơi có tổng bằng tổng lợi ích cho tất cả người chơi trong game, cho mỗi sự kết hợp của các chiến lược, luôn luôn làm tăng thêm số không (không chính thức hơn, một lợi ích thủ duy nhất tại các chi phí bằng nhau của những người khác). Poker minh họa một zero-sum trò chơi (bỏ qua khả năng cắt của ngôi nhà), bởi vì có một chiến thắng chính xác số lượng đối thủ của một người bị mất. Các trò chơi có tổng bằng không bao gồm đồng xu và phù hợp với hầu hết các trò chơi hội đồng cổ điển bao gồm Go và cờ tướng.

Nhiều trò chơi được nghiên cứu bởi các nhà lý thuyết trò chơi (bao gồm cả tiến thoái lưỡng nan của tù nhân khét tiếng của) những trò chơi phi zero-sum, bởi vì kết quả có kết quả ròng lớn hơn hoặc nhỏ hơn không. Không chính thức, trong các trò chơi phi zero-sum, tăng bởi một cầu thủ không nhất thiết phải tương ứng với một sự mất mát của người khác.

Trò chơi không đổi tiền tương ứng với các hoạt động như trộm cắp, cờ bạc, nhưng không phải với tình hình kinh tế cơ bản, trong đó có những lợi ích tiềm năng từ thương mại. Nó có thể chuyển đổi bất kỳ trò chơi vào một (có thể không đối xứng) zero-sum game bằng cách thêm một cầu thủ giả (thường được gọi là "hội đồng quản trị") mà thiệt hại bồi thường tiền thắng cược ròng của các cầu thủ.

Đồng thời / Sequential

Trò chơi đồng thời là trận đấu mà cả hai người chơi di chuyển đồng thời, hoặc nếu họ không di chuyển cùng một lúc, các cầu thủ sau đó không nhận thức được hành động của các cầu thủ trước đó '(làm cho chúng có hiệu quả đồng thời). Trò chơi tuần tự (hoặc các trò chơi năng động) là trò chơi mà người chơi sau đó có một số kiến ​​thức về các hành động trước đó. Điều này không cần phải được thông tin đầy đủ về mọi hành động của người chơi trước đó; nó có thể là rất ít kiến ​​thức. Ví dụ, một cầu thủ có thể biết rằng một cầu thủ trước đó đã không thực hiện một hành động cụ thể, trong khi anh ta không biết được những hành động có sẵn khác các cầu thủ đầu tiên thực sự thực hiện.

Sự khác biệt giữa các trò chơi đồng thời và liên tục bị bắt tại cơ quan đại diện khác nhau đã thảo luận ở trên. Thông thường, hình thức bình thường được sử dụng để đại diện cho trò chơi đồng thời, trong khi dạng mở rộng được sử dụng để đại diện cho những người tuần tự. Việc chuyển đổi sâu rộng đến hình thức bình thường là một chiều, nghĩa là nhiều trò chơi dạng mở rộng tương ứng với các hình thức bình thường giống nhau. Do đó, khái niệm về cân bằng của trò chơi đồng thời không đủ để lý luận về trò chơi tuần tự; thấy sự hoàn hảo subgame.

Trong ngắn hạn, sự khác biệt giữa tuần tự và các trò chơi đồng thời như sau:

Tuần tự đồng thời

Thông thường biểu hiện bằng cây quyết định ma trận Mướn đã trả rồi

Trước khi kiến ​​thức

di chuyển của đối phương?

Có không

Thời gian trục? Có không

Còn được biết là

Mở rộng hình thức trò chơi

Trò chơi phong phú

Chiến lược trò chơi

Trò chơi chiến lược

Thông tin hoàn hảo và không hoàn hảo thông tin

Bài chi tiết: Thông tin hoàn hảo

Một trò chơi của thông tin không hoàn hảo (đường nét đứt thể hiện sự thiếu hiểu biết về các phần của cầu thủ 2, chính thức được gọi là một tập hợp thông tin)

Một tập hợp quan trọng của trò chơi tuần tự bao gồm các trò chơi thông tin hoàn hảo. Một trò chơi là một trong những thông tin hoàn hảo nếu tất cả các cầu thủ biết di chuyển trước đây được thực hiện bởi tất cả các cầu thủ khác. Như vậy, chỉ có trò chơi tuần tự có thể được trò chơi của thông tin hoàn hảo bởi vì người chơi trong các trò chơi đồng thời không biết những hành động của các cầu thủ khác. Hầu hết các trò chơi nghiên cứu trong lý thuyết trò chơi là trò chơi hoàn hảo-thông tin. Thú vị ví dụ về các trò chơi hoàn hảo thông tin bao gồm các trò chơi tối hậu thư và rết game. Trò chơi giải trí của trò chơi thông tin hoàn hảo bao gồm cờ vua và cờ. Nhiều trò chơi thẻ trò chơi là thông tin không hoàn hảo, chẳng hạn như xi hoặc hợp đồng cầu.

Thông tin hoàn hảo thường bị nhầm lẫn với các thông tin đầy đủ, đó là một khái niệm tương tự. Đầy đủ thông tin yêu cầu mọi người chơi biết các chiến lược và thưởng phạt dành cho các cầu thủ khác, nhưng không nhất thiết phải là hành động. Trò chơi thông tin không đầy đủ có thể được giảm, tuy nhiên, các trò chơi của thông tin không hoàn hảo bằng cách giới thiệu "động thái của thiên nhiên".

Trò chơi tổ hợp

Trò chơi mà trong đó những khó khăn trong việc tìm kiếm một chiến lược tối ưu bắt nguồn từ sự đa dạng của động thái có thể được gọi là trò chơi tổ hợp. Ví dụ như cờ vua và đi. Các trò chơi có liên quan đến thông tin không hoàn hảo hoặc không đầy đủ cũng có thể có một nhân vật tổ hợp mạnh mẽ, ví dụ cơ thỏ cao. Không có lý thuyết thống nhất giải quyết các yếu tố tổ hợp trong trò chơi.