Tin tức và Xã hộiNền kinh tế

Trạng thái cân bằng Nash. Các lý thuyết về trò chơi dành cho các nhà kinh tế (Dzhon Nesh)

Trong những năm 1930, Dzhon Fon Neyman và Oskar Morgenstern đã trở thành những người sáng lập trong những khu vực hấp dẫn mới của toán học, được gọi là "Lý thuyết trò chơi." Trong những năm 1950 xu hướng này trở nên quan tâm đến các nhà toán học trẻ Dzhon Nesh. lý thuyết cân bằng đã trở thành chủ đề của luận án của mình, mà ông đã viết ở tuổi 21 tuổi. Do đó sinh ra một trò chơi chiến lược mới gọi là "cân bằng Nash", xứng đáng với nhiều năm giải Nobel sau - năm 1994.

Khoảng cách dài giữa các văn bản về luận án và trở thành một thử nghiệm chấp nhận rộng rãi cho toán học. Genius không công nhận kết quả là rối loạn tâm thần nghiêm trọng, mà còn là nhiệm vụ Dzhon Nesh đã có thể giải quyết nhờ vào tâm logicheskumu tuyệt vời. lý thuyết về "cân bằng Nash" của ông đã được trao giải Nobel, và cuộc sống của mình trong bộ phim chuyển thể «Đẹp tâm» ( «A Beautiful Mind") phim.

Ngắn gọn về lý thuyết trò chơi

Kể từ khi lý thuyết về cân bằng Nash giải thích hành vi của con người về sự tương tác, vì vậy bạn nên xem xét các khái niệm cơ bản của lý thuyết trò chơi.

lý thuyết trò chơi nghiên cứu hành vi của những người tham gia (đại lý) trong điều kiện của sự tương tác với nhau vào loại trò chơi trong đó kết quả phụ thuộc vào những quyết định và hành vi của một vài người. Bên sẽ đưa ra quyết định dựa trên sự mong đợi của họ về hành vi của người khác, và điều đó được gọi là một chiến thuật trong game.

Ngoài ra còn có một chiến lược chi phối, trong đó người tham gia nhận được kết quả tốt nhất đối với bất kỳ hành vi của người tham gia khác. Đây là cầu thủ chiến lược bezproigryshnaya tốt nhất.

Song đề tù nhân và mang tính đột phá

tù nhân tiến thoái lưỡng nan - đó là trường hợp với các trò chơi, nơi người chơi buộc phải đưa ra quyết định hợp lý, đạt được một mục tiêu chung về các phương án xung đột. Câu hỏi đặt ra là, trong đó các tùy chọn này nó chọn, nhận ra lợi ích cá nhân và nói chung, cũng như không có khả năng để có được một cái gì đó, và nhiều hơn nữa. Những cầu thủ như được bao bọc trong một điều kiện chơi khó khăn, mà đôi khi làm cho họ suy nghĩ rất hiệu quả.

tiến thoái lưỡng nan này tìm hiểu toán học người Mỹ Dzhon Nesh. Trạng thái cân bằng, mà ông dẫn dắt, là cách mạng theo cách riêng của nó. Ý nghĩ mới mạnh mẽ ảnh hưởng đến quan điểm của các nhà kinh tế về làm thế nào để tạo ra một loạt các cầu thủ trên thị trường, có tính đến lợi ích của người khác, với một tương tác dày đặc và giao điểm của lợi ích.

Tốt nhất là để nghiên cứu lý thuyết trò chơi với các ví dụ cụ thể, bởi vì kỷ luật rất toán học này không phải là một khô và lý thuyết.

Một ví dụ về tiến thoái lưỡng nan của người tù

Ví dụ hai người cam kết cướp, rơi vào tay của cảnh sát và đang bị thẩm vấn trong các buồng riêng biệt. Đồng thời Bộ trưởng cảnh sát cung cấp cho mỗi người tham gia điều kiện thuận lợi, theo đó nó sẽ được phát hành trong trường hợp làm chứng chống lại đối tác của mình. Tại mỗi trong những tên tội phạm có tới thiết lập các chiến lược rằng ông sẽ xem xét:

  1. Cả hai cùng một lúc để làm chứng và nhận được trong tù vì 2,5 năm.
  2. Cả hai cùng một lúc im lặng và nhận 1 năm, bởi vì trong trường hợp này cơ sở bằng chứng về tội lỗi của họ sẽ nhỏ.
  3. Một cho lời khai và nhận được sự tự do, và thứ hai là im lặng và bị 5 năm tù giam.

Rõ ràng, kết quả của các trường hợp phụ thuộc vào quyết định của cả hai bên, nhưng họ không thể đi đến một thỏa thuận, vì ngồi trong các tế bào khác nhau. Ngoài ra mâu thuẫn rõ ràng của lợi ích cá nhân của họ trong cuộc đấu tranh cho lợi ích chung. Mỗi phòng trong số tù nhân có hai lựa chọn, và 4 kết quả khác nhau.

Mạch suy luận logic

Do đó, người phạm tội nhưng phải xem xét các tùy chọn sau:

  1. Tôi im lặng và im lặng đối tác của tôi - cả hai chúng tôi nhận được 1 năm tù giam.
  2. Tôi thuê một đối tác và anh ta đưa cho tôi - cả hai chúng tôi có được 2,5 năm tù.
  3. Tôi im lặng, và đối tác của tôi từ bỏ - Tôi sẽ nhận được 5 năm tù, và ông là miễn phí.
  4. Tôi thuê một đối tác, nhưng ông là im lặng - Tôi có được tự do, và ông 5 năm tù giam.

Dưới đây là một ma trận của giải pháp khả thi và kết quả cho rõ ràng.

Bảng kết quả có thể xảy ra song đề tù nhân.

Câu hỏi đặt ra là mỗi người tham gia sẽ chọn cái nào?

"Im đi, bạn không thể nói" hoặc "không thể giữ im lặng, để nói chuyện"

Để hiểu được sự lựa chọn của đảng, bạn cần phải đi qua chuỗi suy nghĩ của mình. Sau khi lập luận của tội phạm Và nếu tôi nói gì và nói gì đối tác của tôi, chúng tôi sẽ nhận được một thời gian tối thiểu thời gian (1 năm), nhưng tôi không thể nhìn thấy làm thế nào ông sẽ hành xử. Nếu ông cho bằng chứng chống lại tôi, tôi cũng tốt hơn để đưa ra bằng chứng, hoặc tôi có thể ngồi xuống trong vòng 5 năm. Tôi thà ngồi trên 2,5 năm so với 5 năm. Nếu anh ta sẽ nói gì, tôi đặc biệt cần để làm chứng vì tôi nhận được thật tự do. Tương tự như vậy, các cuộc đàm phán và bên B.

Nó rất dễ dàng để hiểu rằng chiến lược chi phối đối với mỗi tội phạm - nó được đưa ra bằng chứng. Điểm tối ưu của trò chơi này xảy ra khi cả hai người phạm tội làm chứng và nhận "giải thưởng" của họ - 2,5 năm tù. lý thuyết trò chơi Nash gọi đó là một sự cân bằng.

giải pháp tối ưu tối ưu Nash

neshevskogo Revolutionariness xem rằng một sự cân bằng như vậy không phải là tối ưu, nếu chúng ta xem xét các cá nhân tham gia và lợi ích cá nhân của mình. Sau khi tất cả, lựa chọn tốt nhất - đó là giữ im lặng và sẽ được phát hành.

Nash Equilibrium - là điểm tiếp xúc quan tâm, trong đó mỗi người tham gia chọn tùy chọn này phù hợp nhất cho anh ta chỉ với điều kiện là những người tham gia khác chọn một chiến lược cụ thể.

Xét hiện thân, khi cả hai người phạm tội im lặng và chỉ nhận được đến 1 năm, nó có thể được gọi là Pareto biến tối ưu. Tuy nhiên, nó chỉ có thể nếu bọn tội phạm đã có thể đi đến một thỏa thuận trước. Nhưng ngay cả điều này sẽ không đảm bảo kết quả này, bởi vì sự cám dỗ để rút lui khỏi những mặc cả và tránh sự trừng phạt tuyệt vời. Thiếu tự tin đầy đủ trong mỗi khác và sự nguy hiểm để có được 5 năm buộc bạn chọn với sự thừa nhận. Để phản ánh trên thực tế là những người tham gia sẽ dính vào các phiên bản với im lặng, đóng vai trò trong buổi hòa nhạc, chỉ đơn giản là không hợp lý. một kết luận như vậy có thể được thực hiện, nếu chúng ta nghiên cứu sự cân bằng Nash. Ví dụ chỉ chứng minh đúng.

Ích kỷ hoặc hợp lý

lý thuyết cân bằng Nash đã kết luận tuyệt đẹp oprovergnuvshie hiện có trước khi nguyên tắc này. Ví dụ, Adam Smith được coi là hành vi của mỗi người trong số những người tham gia như một hoàn toàn ích kỷ, và đó sẽ đem lại hệ thống trở lại cân bằng. Lý thuyết này được gọi là "bàn tay vô hình của thị trường".

Dzhon Nesh thấy rằng nếu tất cả các bên sẽ hành động, chỉ theo đuổi lợi ích riêng của nó, nó sẽ không bao giờ dẫn đến kết quả nhóm tối ưu. Cho rằng suy nghĩ hợp lý là gắn liền với mỗi người tham gia, nhiều sự lựa chọn khả năng, trong đó cung cấp chiến lược cân bằng Nash.

thí nghiệm hoàn toàn nam

Một ví dụ nổi bật là trò chơi "cô gái tóc vàng nghịch lý", trong đó, mặc dù nó có vẻ lạc lõng, nhưng là một minh họa sống động cho thấy cách lý thuyết trò chơi Nash.

Trong trò chơi này, bạn cần phải tưởng tượng rằng các công ty những người tự do đi vào quầy bar. Gần đó là công ty của cô gái, một trong số đó là một lợi thế cho người khác, nói rằng cô gái tóc vàng. Như các chàng trai cư xử, để có được những người bạn gái tốt nhất cho chính mình?

Vì vậy, chàng trai lập luận: nếu tất cả mọi người sẽ được làm quen với các cô gái tóc vàng, thì rất có thể, nó sẽ không nhận được bất cứ ai, sau đó bạn bè của cô sẽ không muốn yêu. Không ai muốn là lựa chọn mùa thu trở lại lần thứ hai. Nhưng nếu các bạn chọn để tránh những cô gái tóc vàng, sau đó xác suất của mỗi chàng trai để tìm một người bạn tốt của các cô gái là rất cao.

tình hình cân bằng Nash là không tối ưu cho những kẻ vì, chỉ theo đuổi lợi ích ích kỷ của họ, người ta sẽ chọn một cô gái tóc vàng. Nó được xem là chỉ theo đuổi lợi ích ích kỷ sẽ là tương đương với sự sụp đổ của lợi ích nhóm. trạng thái cân bằng Nash có nghĩa rằng tất cả các chàng trai đang hành động vì lợi ích riêng của mình, đó là tiếp xúc với lợi ích của cả nhóm. Tùy chọn này phụ tối ưu cho mỗi người, nhưng tối ưu cho mỗi căn cứ vào tổng số thành công của chiến lược.

toàn bộ cuộc sống của chúng ta là một trò chơi

Ra quyết định trong thế giới thực là rất giống với các trò chơi, nơi bạn mong đợi một hành vi hợp lý nhất định từ các thành viên khác. Trong kinh doanh, làm việc trong một nhóm, trong công ty hoặc thậm chí trong một mối quan hệ với người khác giới. Từ các giao dịch lớn và các tình huống cuộc sống bình thường tất cả mọi thứ phụ thuộc vào một đạo luật cụ thể.

Tất nhiên, tình huống trận đấu được coi là tội phạm và thanh - nó chỉ là hình ảnh minh họa tuyệt vời cho thấy một trạng thái cân bằng Nash. Ví dụ về các tình huống khó xử như vậy thường phát sinh trên thị trường thực tế, và đặc biệt là trong trường hợp của hai công ty độc quyền kiểm soát thị trường.

chiến lược hỗn hợp

Thường thì chúng ta vovlekaemy không chỉ một mà trong một số trò chơi. Bằng cách lựa chọn một trong các tùy chọn cho cùng một trò chơi, hướng dẫn bởi một chiến lược hợp lý, nhưng có được một trò chơi khác nhau. Sau khi một số quyết định hợp lý, bạn có thể thấy kết quả của bạn thì không. Có gì để mất?

Hãy xem xét hai loại chiến lược:

  • Tinh khiết chiến lược - là hành vi của người tham gia, mà là dựa trên sự phản ánh về hành vi có thể của những người tham gia khác.
  • chiến lược hỗn hợp hoặc chiến lược thường - thay đổi luân phiên này của chiến lược tinh khiết lựa chọn ngẫu nhiên hay chiến lược tinh khiết với một xác suất nhất định. Chiến lược này cũng được gọi là rendomizirovannoy.

Xét hành vi này, chúng ta có được một cái nhìn mới về sự cân bằng của Nashua. Nếu trước đó người chơi chọn chiến lược một lần người ta có thể tưởng tượng, và hành vi khác. Có thể giả định rằng tùy chọn mà người chơi lựa chọn chiến lược một cách ngẫu nhiên với một xác suất nhất định. Trò chơi mà bạn không thể tìm thấy một trạng thái cân bằng Nash trong chiến lược tinh khiết, luôn luôn có chúng trộn lẫn.

Nash Equilibrium trong chiến lược hỗn hợp gọi là trạng thái cân bằng hỗn hợp. Đó là một sự cân bằng, trong đó mỗi người tham gia chọn tần số tối ưu lựa chọn chiến lược của họ, với điều kiện các thành viên khác chọn chiến lược của họ với một tần số xác định trước.

Hình phạt và chiến lược hỗn hợp

Một ví dụ về một chiến lược hỗn hợp có thể được đưa vào trò chơi của bóng đá. Hình minh họa tốt nhất của chiến lược hỗn hợp - điều này có lẽ là một loạt các hình phạt. Vì vậy, chúng ta có một thủ môn đã có thể nhảy chỉ trong một góc, và người chơi sẽ đánh bại một hình phạt.

Vì vậy, nếu lần đầu tiên một người chơi lựa chọn một chiến lược để thực hiện một tác động ở góc trái và thủ môn cũng rơi vào góc này và bắt bóng, làm thế nào có thể phát triển sự kiện lần thứ hai? Nếu một cầu thủ đang diễn ra để đánh bại các góc đối diện, nó có khả năng là quá rõ ràng, nhưng cũng là một đòn giáng mạnh vào cùng một góc không kém phần rõ ràng. Do đó, thủ môn, và bột không có lựa chọn nào khác phải dựa vào lựa chọn ngẫu nhiên.

Do đó, xen kẽ lựa chọn ngẫu nhiên của một chiến lược tinh khiết, máy nghe nhạc và thủ môn pytajutsja nhất định để có được kết quả tối đa.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 vi.unansea.com. Theme powered by WordPress.