Giới thiệu sơ lược về
lý thuyết trò chơi
Giới thiệu sơ lược về
lý thuyết trò chơi
Trong các thị trường chỉ với một số ít đối thủ cạnh tranh, kết cục của cạnh tranh sẽ phụ thuộc vào thứ chúng ta gọi là tương tác chiến lược giữa các công ty: lựa chọn tối ưu nhất cho công ty của bạn phụ thuộc vào lựa chọn của đối thủ và những gì họ chọn để đối phó với lựa chọn của bạn. Để tiếp cận, phân tích và dự đoán những gì có thể xảy ra trong tình huống này, chúng ta sử dụng bộ công cụ có tên gọi lý thuyết trò chơi (như tên gọi, chúng ta mô tả các tình huống có tồn tại tương tác chiến lược như những trò chơi và các bên tham gia tình huống là những người chơi). Sau đây là một giới thiệu ngắn về phân ngành này của kinh tế học.
Một ví dụ
Lừa (L) và Ngựa (N) thiết lập một thị trường nhị quyền trong lĩnh vực giao hàng nhanh. L là người chơi dẫn đầu thị trường với thị phần lớn gấp 3 lần N, nhưng cả hai công ty đều làm ăn tốt trong những năm gần đây: L và N đã ghi nhận thu nhập hoạt động lần lượt đạt 100 tỷ và 40 tỷ VND. Tuy nhiên, L lo ngại N có thể sử dụng công nghệ xe tự hành để giao hàng nhanh hơn. Mặc dù có chi phí đầu tư ban đầu đắt đỏ, công nghệ này sẽ cho phép N cân bằng thị phần với L, dẫn đến thu nhập hoạt động 60 tỷ VND cho cả hai công ty. Để đối phó, L cũng cân nhắc áp dụng công nghệ này. Nếu cả hai đều sử dụng công nghệ xe tự hành, L sẽ có thu nhập hoạt động 80 tỷ VND và N có thu nhập hoạt động 20 tỷ VND. Nếu chỉ có L áp dụng công nghệ xe tự hành, L sẽ tạo ra thu nhập hoạt động 90 tỷ VND và N tạo ra thu nhập hoạt động 10 tỷ VND. Do cần có thời gian triển khai công nghệ, L cần cam kết với dự án trước khi biết N sẽ làm gì.
Quyết định ở đây không dễ dàng đối với L. Trong tất cả các trường hợp chấp nhận áp dụng công nghệ, L đều tạo ra thu nhập hoạt động thấp hơn so với năm trước do chi phí đầu tư lớn. Tuy nhiên, nếu L không đầu tư mà N đầu tư, L sẽ phải chịu thua lỗ nhiều nhất. Do đó, lựa chọn tối ưu của L phụ thuộc hoàn toàn vào lựa chọn của N. Tình hình đối với N cũng tương tự, lựa chọn tối ưu của N phụ thuộc hoàn toàn vào lựa chọn của L. Đây là một tình huống "tôi nghĩ rằng bạn nghĩ rằng tôi nghĩ rằng bạn nghĩ rằng tôi nghĩ…" Và tình huống này là lý do tại sao phân tích dự đoán kết cục ở đây rất khó nắm bắt nếu không suy nghĩ một cách có hệ thống.
Mô tả trò chơi
Bước đầu tiên trong việc phân tích một tình huống như trên là tìm ra một cách để mô tả nó. Một cách mô tả phổ biến và hữu ích là sử dụng một ma trận thưởng-phạt. Ma trận này mô tả các kết cục xảy ra khi các lựa chọn của hai người chơi tương tác với nhau (theo quy ước, thưởng-phạt dành cho người chơi được mô tả trên các hàng sẽ được ghi bên trái).
Ma trận cho thấy, trong trường hợp L đầu tư và N không đầu tư chẳng hạn, chúng ta sẽ nhận được kết cục tương đương với ô ở trên bên phải, tức là L tạo ra thu nhập hoạt động 90 tỷ VND và N tạo ra thu nhập hoạt động 10 tỷ VND. L chỉ quan tâm đến thưởng-phạt của mình. Nhưng để dự đoán lựa chọn của N, L cần phải hiểu được thưởng-phạt của N.
Dự đoán
Liệu L có thể dự đoán được gì trong tình huống này? Rõ ràng (không đầu tư, không đầu tư) không phải là một dự báo tốt: nếu cả hai công ty tin vào dự báo này, khi đó N sẽ muốn chọn đầu tư (N sẽ nhận được thu nhập hoạt động 60 tỷ VND thay vì 40 tỷ VND), mẫu thuẫn với dự đoán. Ngược lại, kết cục (đầu tư, đầu tư) có vẻ là một dự đoán khả thi: nếu cả hai đều tin vào dự đoán này thì lựa chọn tối ưu của cả hai công ty đều sẽ trùng khớp với dự đoán (cả 2 công ty đều đầu tư do L có thu nhập 80 tỷ VND thay vì 60 tỷ VND và N nhận có thu nhập 60 tỷ VND thay vì 40 VND). Nhìn chung, nếu tất cả các bên tham gia trò chơi đều thông minh và hiểu rõ tình huống thì tất cả các dự đoán tốt đều thoả mãn đặc điểm các bên tham gia muốn thực hiện đúng hành động trong dự đoán. Một dự đoán như vậy được gọi là cân bằng Nash, được đặt tên theo John Nash, người nhận giải Nobel Kinh tế học vì đã phát triển khái niệm này.
Có một cách có hệ thống để tìm ra tất cả những dự đoán như trên. Thay vì xem xét từng ô một trong ma trận, chúng ta sẽ xem xét nguyên một cột hoặc một hàng mỗi lần: nếu - như một dự đoán tiềm năng - L chọn không đầu tư (tương ứng với hàng ở dưới), lựa chọn tối ưu của N sẽ là gì? Câu trả lời, được gọi là câu trả lời tốt nhất (best response) là chọn đầu tư (để nhận được 60 tỷ VND thay vì 40 tỷ VND nếu không đầu tư). Chúng ta mô tả việc này bằng cách gạch dưới thưởng-phạt của N (60) trong hàng không đầu tư của L.
Trong bảng trên, chúng ta lặp lại quy trình này cho tất cả hàng và cột. Tại cân bằng Nash, lựa chọn của mỗi công ty phải là tối ưu xét đến lựa chọn của công ty còn lại, có nghĩa là các lựa chọn phải là trả lời tốt nhất của nhau. Tình huống này tương ứng với ô mà chúng ta gạch dưới cả hai con số thưởng-phạt. Trò chơi chúng ta mô tả ở đây có một cân bằng Nash: (đầu tư, đầu tư).
Một trò chơi không nhất thiết phải có cân bằng Nash hoặc có thể có nhiều cân bằng Nash. Trò chơi mô tả trong bảng sau, chẳng hạn, có hai cân bằng Nash. Trong ví dụ này, hai người yêu nhau hẹn nhau nhưng lại quên đồng ý địa điểm gặp mặt: trước Nhà hát lớn hay Hồ Gươm. Một tình huống như vậy sẽ có hai cân bằng Nash (Nhà hát lớn, Nhà hát lớn) và (Hồ Gươm, Hồ Gươm).
Dự đoán trong những trò chơi này mang lại cho các chuyên gia chiến lược hiểu biết về những tương tác phức tạp hơn trong đời thực thông qua các mô hình đơn giản hoá tập trung vào đánh đổi chủ chốt của tương tác chiến lược. Những hiểu biết như vậy có thể là một điểm khởi đầu để tìm ra giải pháp tốt hơn. Trong trò chơi đầu tư giữa L và N ở trên chẳng hạn, N có thể cố gắng cam kết chọn không đầu tư. Nếu cam kết này có thể tin được, L cũng sẽ chọn không đầu tư. Một kết cục mang tính cộng tác như vậy sẽ mang lại thưởng-phạt tốt nhất cho cả hai công ty. Về cơ bản, cam kết không đầu tư của N là một hành động thay đổi cuộc chơi.
Lý thuyết trò chơi nâng cao
Cũng như với mọi mô hình khác liên quan đến hành vi con người, các mô hình lý thuyết trò chơi sử dụng rất nhiều giả định đơn giản hóa. Lý thuyết trò chơi thường giả định mọi người đều hiểu rõ cấu trúc trò chơi và các dự đoán, người chơi biết (chắc chắn) thưởng-phạt cho mỗi người, mọi người đều hành động duy lý… Khi những giả định này không còn đúng, kết cục có thể không còn giống như dự đoán. Vì lý do này, chúng ta không nên sử dụng trực tiếp những dự đoán lý thuyết trò chơi; thay vào đó, chúng ta chỉ nên sử dụng lý thuyết trò chơi để tìm hiểu các xu hướng hành động của các bên tham gia và triển vọng xảy ra những hành động thay đổi cuộc chơi (như cam kết không đầu tư của N trong ví dụ trên). Ở cấp độ nâng cao của lý thuyết trò chơi, một số giả định đơn giản hóa (ví dụ như thứ tự của các hành động, thông tin hoàn hảo, các mục tiêu khác) sẽ được tháo bỏ để mô tả những trò chơi phức tạp hơn. Chúng ta sẽ tìm hiểu thêm về những mức độ này trong các bài viết sau.