ورقة مصطلح على نظرية اللعبة | صنع القرار | اقتصاديات

فيما يلي ورقة مصطلح حول "نظرية اللعبة" للفئة 9 و 10 و 11 و 12. ابحث عن فقرات ، أوراق طويلة وقصيرة الأجل حول "نظرية اللعبة" مكتوبة خاصة لطلاب المدارس والجامعات.

ورقة الأجل على نظرية اللعبة


محتويات ورقة الأجل:

  1. ورقة مصطلح على مقدمة لنظرية اللعبة
  2. ورقة مصطلح حول معضلة السجين: إستراتيجية مسيطرة
  3. مصطلح ورقة على برتراند مفارقة
  4. ورقة مصطلح عن الأبعاد الزمنية
  5. ورقة مصطلح عن النظرية الشعبية


1. ورقة مصطلح حول مقدمة لنظرية اللعبة :

نظرية اللعبة تستخدم على نطاق واسع في مواضيع مختلفة. يزداد استخدام نظرية اللعبة يوما بعد يوم بسبب تعقيدات المكاسب الاقتصادية. في الرياضيات ، تستخدم نظرية اللعبة لشرح العلاقة بين المتغيرات. مشتق شجرة القرار لفهم المكاسب من أي لعبة. نظرية اللعبة هي من الأفراد والجماعات والشركات. كل فرد هو وكيل اقتصادي في الطبيعة. في كل نقطة من اللعبة ، يتوقع الفرد بعض المكاسب الاقتصادية من أفعال مختلفة.

يحصل العملاء أو الشركة على فائدة للمضي قدمًا أو التواطؤ أو عدم الاتفاق مع الطرف الآخر في اللعبة. فائدة متساوية لكلا الطرفين هو توازن ناش. يمكن تفسيره بشكل مختلف على النحو التالي. نظرية اللعبة هي نظرية صنع القرار في ظل ظروف عدم اليقين والاعتماد المتبادل. في نظرية اللعبة ، يتم دراسة السلوك البشري في الموقف الاستراتيجي ويتم التقاط الوضع الرياضي. تتكون اللعبة الاستراتيجية من مجموعة من اللاعبين ، والتي قد تكون مجموعة من العقد أو عقدة فردية.

مجموعة من الإجراءات لكل لاعب لاتخاذ قرار وتفضيلات على مجموعة من ملفات تعريف الإجراءات لكل لاعب. في أي لعبة فائدة يمثل دافع اللاعبين. تحاول تطبيقات نظرية اللعبة دائمًا إيجاد التوازن. إذا كانت هناك مجموعة من الاستراتيجيات مع الخاصية التي لا يمكن لأي لاعب جني الأرباح من خلال تغيير إستراتيجيته ، بينما يحتفظ اللاعبون الآخرون بإستراتيجياتهم دون تغيير ، فإن مجموعة الاستراتيجيات والمكافآت المقابلة لها تشكل توازن ناش.


2. ورقة مصطلح عن معضلة السجين: استراتيجية سائدة :

عادة ما يتم تحديد معضلة السجناء بين لاعبين اثنين. نظرية اللعبة تفترض أن كلا اللاعبين يتصرفان بعقلانية. إلا أن التحقيقات الواقعية للسلوك الجماعي تتطلب نموذجًا متعدد الأشخاص للعبة يعمل كصياغة رياضية لما هو خاطئ في المجتمع البشري. قد تؤدي الدراسة إلى فهم أفضل للعوامل التي تحفز أو تمنع السلوك التعاوني داخل النظم الاجتماعية. إنه يلخص الخصائص الأساسية لكل جماع اجتماعي تقريبًا. تم التحقيق في جوانب مختلفة من معضلة السجناء متعددة الأشخاص في الأدب.

معضلة السجين تعطي الإستراتيجية السائدة. الإستراتيجية المهيمنة مهمة لدراسة إستراتيجية اللاعب. إنها إستراتيجية سائدة من حيث إستراتيجية اللاعب الآخر. لهذا الغرض ، نستخدم الترميز. S-Smita هو مزيج من استراتيجيات كل لاعب باستثناء اللاعب Smita. أفضل رد على Player i أو أفضل استجابة للاستراتيجيات Si ، التي اختارها اللاعبون الآخرون. في نفس الوقت ، تعد s * i هي أفضل استراتيجية يختارها اللاعب ith والتي تحقق له أكبر عائد.

هو مكتوب على النحو التالي:

يشرح التدوين أعلاه أن أفضل إستراتيجية (s * i) لها أعلى ربح. الفرد اختيار أفضل الاستراتيجيات التي هي الاستراتيجيات السائدة. وبالتالي فإن الاستراتيجيات السائدة هي استراتيجيات التوازن. استراتيجيات التوازن هذه هي أفضل استجابة للاعب آخر. الإستراتيجية السائدة غير موجودة في لعبة الرفاهية. في لعبة الرفاهية ، لا توجد استراتيجيات سائدة. يعمل اللاعبون على تصرفات الآخرين كأفضل الاستراتيجيات. وتشمل برامج الرعاية الحكومية NREGA في الهند. العمل الذي يعاقب عليه بموجب هذا البرنامج هو توفير الفوائد لفقراء الريف.

تستند معضلة السجين إلى افتراضات معينة:

1. السجناء معضلة هي لعبة شخصين. هناك العديد من الأشخاص يتفاعلون مع بعضهم البعض.

2. افترضنا أنه لا يوجد اتصال بين السجينين. إذا تواصلوا والتزموا بالتنسيق فستكون النتيجة مختلفة.

في معضلة السجناء ، يتفاعل سجينان مرة واحدة فقط. لنفترض أن سميتا وديبا هي السجون. إذا كان كلاهما قد ارتكبوا الجريمة واشتعلت بهم الشرطة ، فإن لديهم عددًا من الاستراتيجيات. إذا اعترف سميتا وديبا ، فكل واحد منهم يعاقب بالسجن لمدة عشر سنوات. ولكن يتم منحهم خيار الاعتراف والإنكار. وتنفي كل من سميتا وديبا تورطهما في الجريمة ، ثم يحكم على كليهما بالسجن لمدة عامين. هنا توجد فرصة لتطبيق معضلة السجين.

إذا اعترفت سميتا ، فسوف يتم إطلاق سراحها. في الوقت نفسه ، سيتم الحكم على ديبا لمدة 15 عامًا في السجن. معضلة السجين مباراتان. وذلك لأن لاعبين اثنين سيلعبان إجراءين مختلفين وسيحاول كلاهما الاستفادة بشكل أكبر من قراره. كلاهما لديه استراتيجيات مختلفة كما يعترف ، ينكر إلخ.

سميتا وديبا لديهم استراتيجية مهيمنة خاصة بهم. ديبا لا تعرف ما هو العمل الذي اختاره سميتا. إذا اختارت ديبا التصرف ، تواجه سميتا نفي المردود وإذا اعترفت فسوف تواجه المردود 0. لنفترض أن ديبا تختار الإعتراف بأنها ستواجه نفي المردود من قبل سميتا البالغة 15 عامًا. لنفترض أنها اعترفت أن المردود هو 10. في المثال أعلاه ، ديبا ليست أفضل حالا مع الاعتراف. انها تحصل على 0 مكافأة. الإستراتيجية السائدة في المثال أعلاه معترف بها. مكافأة التوازن لكلا اللاعبين (10 ، 10). لكن كلا من ديبا وسميتا ينكران ثم يحصلان على (2 ، 2) نفس المكافآت.

إذا كان التوازن هو الإستراتيجية السائدة ، فلا يهم مجموعة المعلومات. لنفترض أن Deepa يُسمح له بالاعتراف أو الرفض ، ثم Smita تتحرك قبل اتخاذ القرار دون تغيير. معضلة السجين مفيدة في النظريات الاقتصادية المختلفة. يتم استخدامه في تسعير احتكار القلة ، وعروض العطاءات ، وجهود البائع ، والمساومة السياسية وسباقات التسلح. نظرية اللعبة والأمثلة غير واقعية لكثير من العلماء. انهم لا يواجهون مثل هذا النوع من الحالات. التفكير في بعض الأحيان من حيث نظرية اللعبة مهم أيضا.

نحن بحاجة إلى فهم الاستراتيجيات واللاعبين في نقاط مختلفة. ملاحظة شائعة في التجارب التي تنطوي على تكرار محدود لمعضلة السجناء هي أن اللاعبين لا يلعبون دائمًا الاستراتيجيات المهيمنة لفترة واحدة (finking) ، ولكنهم يحققون قدرًا من التعاون. ومع ذلك ، فإن التوازن في كل مرحلة هو توازن ناش الوحيد في اللعبة المتكررة بشكل نهائي.

نوضح هنا كيف يمكن لمعلومات غير كاملة حول خيارات أو دوافع أو سلوك أحد اللاعبين أو كلاهما أن تفسر التعاون الملحوظ. على وجه التحديد ، نحن نوفر عددًا محددًا من الجولات التي يمكن لعب Fink فيها ، حيث قد يكون هناك لاعب واحد قد يلتزم باستراتيجية "Tit-for-Tat".

أنواع الألعاب :

هناك أنواع مختلفة من الألعاب في نظرية اللعبة. ألعاب التعاونية ، غير التعاونية ، والرعاية الاجتماعية ، والاستراتيجية المهيمنة هي ألعاب أكثر فائدة ونحن بحاجة إلى فهم سلوك الوكلاء.

لعبة تعاونية وغير تعاونية :

في اللعبة التعاونية ، يمكن للاعبين الالتزام تجاه بعضهم البعض. في بعض الأحيان يتجاوزون هذا الالتزام. هو عكس ذلك في اللعبة غير التعاونية. في اللعبة غير التعاونية ، اللاعبون ليسوا ملزمين بالتزاماتهم. تستند جميع الألعاب في النموذج التعاوني إلى مبدأ Pareto الأمثل والإنصاف والإنصاف. معظم الألعاب غير التعاونية اقتصادية بطبيعتها. يقوم اللاعبون بتعظيم فائدتهم وفقًا للقيود المعلنة. تركز نظرية اللعبة التعاونية على خصائص النتيجة بدلاً من الاستراتيجيات.

هذه الاستراتيجيات في كثير من الأحيان تحقيق النتائج. يتم استخدام اللعبة التعاونية لنموذج المساومة في الاقتصاد الجزئي التطبيقي. هذه اللعبة هي أكثر ملاءمة من اللعبة غير التعاونية. معضلة السجناء هي لعبة غير تعاونية. يمكن السماح بهذا النموذج للاعبين ليس فقط للالتزام ولكن لفرض قيود ملزمة. غالبًا ما تسمح الألعاب التعاونية للاعبين بتقسيم المكاسب من الألعاب التعاونية. غالبًا ما يسمح للاعبين بتقسيم المكاسب من التعاون عن طريق إجراء عمليات دفع جانبية.

يوجد المثال التالي الذي يوضح أنواع الألعاب المختلفة:

أنا. لعبة تعاونية بدون تعارض:

يختار أعضاء القوى العاملة مهام ثقيلة بنفس القدر للقيام بها لتنسيق أفضل مع بعضهم البعض. تم التوصل إلى وحدة في القوى العاملة على الرغم من أن لديهم استراتيجيات متنوعة.

ثانيا. لعبة تعاونية مع صراع:

لعبة حيث القوى العاملة لديها استراتيجيات مختلفة ولكن تم العثور على استراتيجيات مشتركة وأنه تم التوصل إلى وجود تعاون فيما بينها.

ثالثا. لعبة غير تعاونية مع صراع:

معضلة السجناء هي أفضل مثال على ذلك. هنا لاعبين لديهم استراتيجيات مختلفة. هذه الاستراتيجيات تبقى مستقلة عن بعضها البعض.

د. لعبة غير تعاونية بدون تعارض:

وضعت شركتان معيارًا للمنتج دون الاتصال ببعضهما البعض.

الهيمنة المتكررة: معركة بحر بسمارك :

وهذا يعني وجود تركيبة إستراتيجية يتم العثور عليها عن طريق حذف إستراتيجية مسيطرة ضعيفة من الإستراتيجية البديلة. أحد اللاعبين يعيد حسابه لإيجاد الإستراتيجية المتبقية التي يسيطر عليها بشكل ضعيف. حذف واحد منهم ومواصلة العملية حتى تبقى استراتيجية واحدة فقط لكل لاعب.

عندما يتفاعل الناس مع مرور الوقت ، قد تؤثر التهديدات والوعود المتعلقة بالسلوك في المستقبل على السلوك الحالي. الألعاب المتكررة تجسد حقيقة الحياة هذه ، وبالتالي تم تطبيقها على نطاق أوسع من أي نموذج نظري للعبة ، ليس فقط في كل مجال اقتصادي فحسب ، بل أيضًا في مجالات المالية والقانون والتسويق والعلوم السياسية وعلم الاجتماع.

لقد قدمنا ​​مثال معركة Bismarck Sea. معركة بحر بسمارك مثال على ذلك في استراتيجيات الهيمنة المتكررة. إنها مجموعة تقع في جنوب المحيط الهادئ في عام 1943. وقد أمر الجنرال إمامورا بنقل القوات اليابانية عبر بحر بسمارك إلى غينيا الجديدة.

لكن الجنرال كيني يريد قصف نقل القوات. إنها استراتيجيته واختياره في هذه المرحلة. من أجل القيام بذلك ، يجب على إمامورا الاختيار بين طريق شمالي أقصر إلى طريق جنوبي أطول إلى غينو الجديدة ، ويجب أن يقرر كيني مكان إرسال طائراته للبحث عن اليابانيين. الآن هناك خطط بديلة مخططة. لنفترض أن كيني يسلسل طائراته إلى الطريق الخطأ الذي يمكنه أن يتذكرها ولكن عدد أيام القصف تقل.

في المثال ، اللاعبون هم كيني وإمامورا ولكل منهما مجموعة الإجراءات نفسها {الشمال والجنوب}. مردودهم ليست هي نفسها. يفقد إمامورا ما يكسبه كيني بالضبط.

يتم تقديم هذه اللعبة في النموذج التالي:

في اللعبة المذكورة أعلاه لا يوجد لدى كيني ولا إمامورا استراتيجية مسيطرة. سيختار كيني الشمال إذا اعتقد أن إمامورا سيختار الشمال. لكن في الجنوب إذا اعتقد أن إمامورا سيختار الشمال. هناك معضلة سياسية تواجه كلا اللاعبين. لنفترض أنه اعتقد أن كيني سيختار الجنوب وأنه سيكون غير مبال بين الأفعال إذا اعتقد أن كيني سيختار الشمال. ولكن يمكن أن نجد توازناً معقولاً ومحتملاً ، باستخدام مفهوم الهيمنة الضعيفة.

لنفترض أن الاستراتيجية S i تخضع لسيطرة ضعيفة ، ثم توجد بعض الاستراتيجية الأخرى S * i للاعبين i. من الممكن تحقيق عائد أعلى بشكل أفضل في مجموعة من الإستراتيجيات. أنها لا تسفر عن مكافأة أقل. رياضيا ، S ' i يسيطر عليها ضعيف إذا كان هناك S ' i هكذا

يمكن للمرء أن يحدد توازن الإستراتيجية المهيمنة ضعيفًا يعني ملف تعريف الإستراتيجية الذي تم العثور عليه بحذف جميع الاستراتيجيات التي يسيطر عليها كل لاعب ضعيف. الاستراتيجيات التي يسيطر عليها ضعف لا تساعد كثيرا في معركة بسمارك البحر. ومع ذلك ، فإن إستراتيجية إمامورا في الجنوب تهيمن عليها ضعيفة الإستراتيجية الشمالية لأن مردوده من الشمال لا يقل أبداً عن مردوده من الجنوب. إنه أكبر إذا اختار كيني الجنوب. لكن بالنسبة لكيني ، لم يتم السيطرة على أي من الاستراتيجيتين بشكل ضعيف.

يقرر كيني أن يختار إمامورا الشمال وهذا لأنه مهيمن بشكل ضعيف. لذلك كيني يلغي ذلك. يختار إمامورا الجنوب من النظر في مثل هذه الخيارات. بعد حذف عمود الجدول ، يتمتع كيني باستراتيجية قوية مهيمنة: فهو يختار الشمال الذي يحقق أرباحًا أكبر بكثير من الجنوب. تركيبة الإستراتيجية (الشمال ، الشمال) هي توازن مهيمن متكرر وكانت بالفعل (شمال ، شمال) النتيجة في عام 1943.

إذا تحرك Imamura أولاً (الشمال ، الشمال) فسيكون هذا التوازن الوحيد المهم بالنسبة للاعب. هذا لأنه يتحرك أولاً ويمنح اللاعب الآخر مزيدًا من المعلومات قبل أن يتصرف. لنفترض أن كيني قد كسر الشفرة اليابانية ووجد خطة Imamura ثم هناك تسرب للمعلومات ويمكن للاعبين التحرك في وقت واحد. تعتبر معركة Bismarck Sea خاصة لأن مكافآت اللاعبين تصل دائمًا إلى الصفر. هذه الميزة مهمة بما يكفي لتستحق اسمًا.

لعبة مجموع صفر:

إن لعبة sum sum هي لعبة يكون فيها مجموع المكافآت لجميع اللاعبين صفرًا ، مهما كانت الاستراتيجيات التي يختارونها. إذا لم تكن اللعبة عبارة عن مبالغ صفرية ، فهذا يعني أنها مبلغ متغير. في لعبة مجموع صفر ، ما يخسره اللاعب يجب أن يخسره لاعب آخر. من المثال أعلاه ، فإن إستراتيجية الهيمنة المتكررة: معركة بحر بسمارك هي مثال على لعبة مجموع الصفر. لكن لعبة معضلة السجين ليست مثالاً على هذه اللعبة. لا يمكن تغيير المكافآت وجعل لعبة مجموع صفر. لهذا ، هناك حاجة لتغيير الطابع الأساسي للألعاب.

ناش التوازن :

ناش التوازن هو مفهوم التوازن القياسي في الاقتصاد الجزئي الحديث. يستخدم على نطاق واسع في نماذج الاقتصاد الجزئي المختلفة. لنفترض أن النموذج لا يفترض مفهوم توازن معينًا ولكنه يستخدم بعد ذلك ك ناش أو بعض التحسينات في توازن ناش. ناش التوازن هو نوع معين من التوازن التوقعات العقلانية. توازن ناش هو موقف يختار فيه كل لاعب إستراتيجية مثالية بالنظر إلى الإستراتيجية المختارة للاعب الآخر.

في توازن ناش ، يعد اختيار إستراتيجية كل لاعب أفضل استجابة لخيار الإستراتيجية. إنها أفضل استجابة للإستراتيجيات التي لعبها بالفعل منافسيه. تركيبة الاستراتيجية S * هي توازن ناش. لنفترض أن اللاعب ليس لديه حافز للانحراف عن استراتيجيته ، ثم لديه حافز للانحراف عن استراتيجيته بالنظر إلى أن اللاعبين الآخرين لا يحيدون.

لنفترض أنه يُطلب من أحد الأطفال والبالغين الوقوف في الصندوق مع لوحة خاصة من أحد الأطراف وموزع طعام من الجهة الأخرى. الشخص البالغ لديه إستراتيجية مهيمنة قوية للحصول على الطعام بينما الطفل لديه إستراتيجية مهيمنة ضعيفة. لنفترض أن الشخص البالغ وصل إلى الموزع أولاً ، ثم لن يحصل الطفل إلا على وحدة واحدة بقيمة تركه. لنفترض أن الطفل قد وصل أولاً إلى تناول المزيد من وحدات الطعام ، وإذا وصل كلاهما في نفس الوقت ، فإن الطفل يحصل على وحدات أقل من الطعام.

أعلاه بين قوسين لا يظهر توازن الاستراتيجية المهيمنة. ذلك لأن ما يختاره الكبار يعتمد على ما يعتقد أن الطفل سيختاره. لنفترض أن الشخص البالغ يعتقد أن الطفل سيضغط على اللوحة. سوف تنتظر الكبار من قبل موزع. لكن الكبار يعتقدون أن الطفل سينتظر ثم يضغط. يوجد توازن متكرر للهيمنة (اضغط ، انتظر).

سوف نستخدم خطًا مختلفًا من التفكير لتبرير مثل هذه النتائج. المثال أعلاه يوضح تركيبة الإستراتيجية (اضغط ، انتظر) هو توازن ناش. تتمثل طريقة التعامل مع توازن ناش في اقتراح مجموعة من الإستراتيجيات. من الضروري اختبار أفضل استجابة لكل لاعب لاستراتيجية الآخرين.

لنفترض أن الكبار يختارون الصحافة ويواجه الطفل الاختيار بين المكافأة 2 من الضغط و 8 من الانتظار. في الوقت نفسه ، إذا كان الراشد مستعدًا للانتظار وكان الطفل يختار الانتظار ، فسيكون لدى الشخص الاختيار بين مكافأة قدرها 8 من الضغط و 0 من الانتظار. هذا يؤكد أن انتظار الصحافة هو توازن ناش وفي الواقع هو توازن ناش الفريد.

هذا التوازن ناش هو إما ضعيفة أو قوية. توازن ناش الضعيف هو عدم مساواة صارمة. يجب ألا يكون أي لاعب غير مبال بين إستراتيجية توازنه وبعض الإستراتيجيات الأخرى. كل استراتيجية مهيمنة هي توازن ناش ولكن ليس كل استراتيجية ناش متوازنة هي توازن. لنفترض أن الإستراتيجية هي إستراتيجية سائدة ثم إنها أفضل استجابة لأي إستراتيجيات يختارها اللاعبون الآخرون. ويشمل استراتيجية التوازن الخاصة بهم. إذا كانت الإستراتيجية جزءًا من توازن ناش ، إذا احتجت إلى استجابة أفضل للاعبين الآخرين.


3. ورقة مصطلح عن برتراند مفارقة:

تم تطوير مفارقة برتراند في عام 1883. وهي امتداد لنموذج كورنو. يعتمد نموذج مفارقة برتراند على الافتراضات ويتم شرحها على النحو التالي.

افتراض:

(ط) تنتج شركتان سلعًا متطابقة "غير متمايزة". هذه السلع هي بدائل مثالية في وظيفة المرافق المستهلك.

(2) المستهلكون يشترون من المنتج الذي يتقاضى أقل سعر.

(3) تواجه كل شركة جدول طلب يساوي نصف طلب السوق بالأسعار العامة.

(4) تقوم الشركات دائمًا بتوفير السلع حسب الطلب الذي تواجهه.

وظيفة الطلب في السوق هي q = D (ع)

تتحمل كل شركة تكلفة c لكل وحدة إنتاج. ربح الشركة أنا

حيث يُشار إلى الطلب على إنتاج الشركة i يتم إعطاء بواسطة

الربح الإجمالي يعرف بأنه

لا يمكن أن يتجاوز هذا الربح الإجمالي الربح الاحتكاري

يمكن لكل شركة أن تضمن لنفسها ربحًا غير سلبي. من الممكن فرض سعر أعلى من التكلفة الحدية. لذلك فإن أرباح الشركة موضحة

تختار الشركة أسعارها في وقت واحد وغير تعاوني. توازن ناش في الأسعار يشار إليه أحيانًا برصيد برتراند. إنه زوج من الأسعار (P * 1 ، P * 2 ). يزيد سعر كل شركة من أرباح تلك الشركة إلى حد كبير بالنظر إلى سعر الشركات الأخرى. رسميا ، للجميع أنا = 1 و 2 و

للجميع ع ط

مفارقة برتراند (1883) تنص على أن التوازن الفريد وشركتين يتقاضيان سعرًا تنافسيًا.

والدليل هو على النحو التالي

النظر على سبيل المثال

الشركة ليس لديها طلب وأرباحها صفر. من ناحية أخرى إذا كانت شركة واحدة التهم

الآن positive هو إيجابي وصغير. يحصل على الطلب في السوق بأكمله ، D (P2 * - ε) وله هامش ربح إيجابي

لذلك لا يمكن أن يتصرف المرء في مصلحته الخاصة إذا كان يتقاضى P 1 *.

الآن لنفترض ذلك

ثم ربح شركة واحدة

إذا قامت الشركة بتخفيض سعرها قليلاً إلى P1 * ⎯ ε يصبح ربحها

إنه أكبر للصغار. في الحالة المذكورة أعلاه ، تزداد حصة السوق من الشركة بطريقة متقطعة. وذلك لأن أي شركة سوف تتقاضى رسومًا أقل من تكلفة الوحدة C. وستحقق الشركة الأقل سعراً ربحًا سلبيًا. لقد تركنا مع شركة أو شركتين تشحنان بالضبط c. من أجل إظهار أن كلتا الشركتين تتقاضى رسوم افترض

الشركة الثانية التي لا تحقق أي ربح ويمكنها رفع سعرها قليلاً. ولكن لا يزال بإمكانه توفير كل الطلب وتحقيق ربح إيجابي - تناقض.

استنتاج هذا النموذج البسيط هو على النحو التالي. لقد كتبناه في النقاط:

أنا. سعر هذه الشركة بتكلفة هامشية.

ثانيا. أن الشركات لا تحقق أرباحًا

نحن نطلق على هاتين الحالتين برتراند بارادوكس لأنه من الصعب تصديق أن الشركات العاملة في الصناعات التي لا تنجح أبداً في التلاعب بها.

سعر السوق لجني الأرباح:

في استنتاج الحالة المتماثل الأول والثاني لا يصمدان ، في الواقع يمكن إظهار ما يلي:

أنا. أن كلا الشركتين رسوم السعر ع = ج 2 ، و

ثانيا. تحقق الشركة 1 ربحًا (c 2 -c 1 ) D (c 2 ) والشركة 2 لا تحقق ربحًا.

وبالتالي فإن شركة 1 تهمة أعلى من التكلفة الحدية وتحقق ربحًا إيجابيًا التوازن برتراند لم يعد الرفاه الأمثل. ولكن مرة أخرى ، فإن الاستنتاج هو أن الشركة متوترة قليلاً حيث تحقق ربحًا ضئيلًا للغاية إذا كانت C2 قريبة من C1 والشركة الثانية لا تحقق ربحًا على الإطلاق.

حل لبرتراند بارادوكس:

في النموذج أعلاه ، وضعنا ثلاثة افتراضات حاسمة. الآن من أجل إثبات مفارقة برتراند ، نحتاج إلى تخفيف افتراض واحد مما سبق.

The Edge Worth Solution:

قام The Edge بقيمة حل مفارقة Bertrand في عام 1897. لقد حل مفارقة Bertrand من خلال فرض قيود على السعة التي لا تستطيع الشركات من خلالها بيع أكثر مما تستطيع إنتاجه. لفهم هذه الفكرة ، افترض أن إحدى الشركات لديها قدرة إنتاج أصغر من D (c.) التوازن هو (P i * ، P 2 *) = (c ، c). لا يزال نظام سعر التوازن. عند هذا السعر تحقق كلتا الشركتين ربحًا صفريًا.

لنفترض أن الشركة الثانية تزيد سعرها بشكل طفيف ثم تواجه الشركة حاجتها D (ج) لكنها لا تستطيع أن تلبيها. الطريقة العقلانية هي أن بعض المستهلكين يجب أن ينتقلوا إلى شركتين. الشركة الثانية لديها طلب غير صفري. إنه بسعر أعلى من تكلفته الحدية وبالتالي فإنه يحقق ربحًا إيجابيًا. وبالتالي ، فإن حل برتراند ليس التوازن طويل الأجل. القاعدة العامة هي أن النماذج مع قيود القدرات ، والشركات تحقيق ربح إيجابي. سعر السوق أكبر من التكلفة الحدية.


4. ورقة مصطلح عن الأبعاد الزمنية:

الافتراض الحاسم الثاني في النموذج أعلاه هو أن لعبة طلقة واحدة. لا يبدو دائمًا أنه يعكس الواقع الاقتصادي كما هو. في حل Bertrand ، يكون التوازن هو P1 = P2> C. لكنه ليس توازنًا فعليًا في النموذج.

الجواب هو أن هذه الشركة على سبيل المثال يمكن أن تستفيد من انخفاض طفيف في سعرها (أي إلى P ⎯ and) ومن استحواذها الناجم على السوق بأكمله. لا شيء يحدث بعد ذلك بسبب افتراض برتراند الحاسم بلعبة واحدة قصيرة. في الواقع ، من المحتمل أن تخفض الشركة الثانية سعرها لاستعادة حصتها في السوق. إذا أدخلنا هذا البعد الزمني وإمكانية رد الفعل ، فلم يعد من الواضح أن الشركة ستستفيد من خفض سعرها إلى ما دون P2.

يتعين على الشركة أن تقارن الربح على المدى القصير (ارتفاع حصتها في السوق) بالخسارة طويلة المدى في حرب الأسعار.

الكمال لعبة الفرعية:

التوازن المثالي لمتابعة الزعيم الأول:

كمال اللعبة الفرعية هو مفهوم التوازن القائم على ترتيب التحركات والتمييز بين مسار التوازن والتوازن. مسار التوازن هو المسار من خلال شجرة اللعبة التي يتم اتباعها في حالة توازن ، ولكن التوازن نفسه عبارة عن مزيج من الإستراتيجية. ويشمل ردود اللاعب على انحرافات اللاعب الآخر عن التوازن.

الكمال الطريق هو وسيلة للقضاء على بعض توازن ناش الضعيف. تم الكشف عن تدفق توازن ناش في اللعبة اتبع الزعيم الأول ، الذي لديه ثلاث استراتيجيات محضة. ناش التوازن هي واحدة من الاستراتيجيات المعقولة. اللاعبون هم Smita و Deepa ، الذين يختارون أحجام الأقراص.

يكون كلا المرددين أكبر إذا اختاروا نفس الحجم وأكبر إذا نسقوا على الحجم الكبير. تتحرك Smita أولاً حتى تصبح استراتيجيتها أكثر تعقيدًا. على الرغم من أنها يجب أن تحدد إجراءً لكل مجموعة معلومات ، إلا أن مجموعة معلومات Deepa تعتمد على ما تختاره Smita. مجموعة استراتيجية ديبا كبيرة وصغيرة. وهي تحدد أنها تختار كبيرة إذا اختارت smita كبيرة. اختارت الصغيرة إذا سميت اختيار الصغيرة.

وجدنا الاتزان ناش الثلاثة التالية:

من النتائج المذكورة أعلاه التوازن Y هو استراتيجية معقولة لكلا اللاعبين. وذلك لأن ترتيب التحركات يجب أن يكون ذا أهمية للاعبين القرار. المشكلة في الشكل العادي وبالتالي مع توازن ناش البسيط هي أنه يتجاهل من يتحرك أولاً. يتحرك سميتا أولاً ويبدو من المعقول أن يُسمح لـ ديبا. في الواقع يجب أن يُطلب منها إعادة التفكير في استراتيجيتها بعد تحركات سميتا.

الآن النظر في التوازن ديبا استراتيجية Z الصغيرة ، الصغيرة. إذا انحرفت سميتا عن التوازن وكانت تختار كبيرة ، فسيكون من غير المعقول أن تلتزم ديبا برد فعل كبير. لقد اختارت كبيرة بالفعل و Z لن يكون التوازن. تظهر حالة مماثلة أن (كبير ، كبير) هو استراتيجية غير عقلانية لديبا ، وتركنا مع Y باعتباره التوازن الفريد. نقول أن التوازن X و Z هما توازن ناش. لكنها ليست توازن "الكمال" ناش.

تركيبة الإستراتيجية هي توازن مثالي إذا بقيت موازنة على جميع المسارات الممكنة ، كل من مسار التوازن ومساراته التي تتفرع إلى ألعاب فرعية مختلفة. اللعبة الفرعية هي لعبة تتكون من عقدة وهي مفردة في كل قسم من أقسام معلومات اللاعب الذي يخلف العقد. تركيبة الإستراتيجية هي توازن ناش مثالي للعبة الفرعية إذا كان (أ) هو توازن ناش للعبة بأكملها و (ب) قواعد عملها ذات الصلة هي توازن ناش لكل لعبة فرعية.

شكل واسع من اتبع Leader I لديه ثلاث مباريات فرعية:

(ط) اللعبة بأكملها

(ii) تبدأ اللعبة الفرعية في العقدة B1

(ج) اللعبة الفرعية التي تبدأ من العقدة B2

تركيبة الإستراتيجية x ليست توازنًا مثاليًا للعبة فرعية لأنها ناش فقط في الألعاب الفرعية (1) و (3). ولكنها ليست توازن ناش في اللعبة الفرعية 2. تركيبة الاستراتيجية Z ليست توازنًا مثاليًا للعبة فرعية. ذلك لأن ناش فقط في الألعاب الفرعية (1) و (2) ليست في اللعبة الفرعية (3). ولكن تركيبة الاستراتيجية Y هي ناش في جميع الألعاب الفرعية الثلاث.

أحد أسباب كون الكمال مفهومًا جيدًا هو أن السلوك غير العقلاني في حالة عدم التوازن في حالة التوازن. المبرر الثاني هو أن توازن ناش الضعيف ليس قوياً في التغييرات الصغيرة في اللعبة.

مثال على ردع دخول الكمال:

في هذه اللعبة ، نفترض أن هناك لاعبين اثنين. الشركة الأولى هي الشركة الجديدة الداخلة والأخرى هي الشركة العليا. المعلومات مثالية وغير مؤكدة.

هناك نوعان من الأحداث والأحداث التي لوحظت في هذه اللعبة:

(1) تقرر الشركة الداخلة الجديدة ما إذا كانت ستدخل أم لا

(2) في حالة دخول المشارك ، يمكن للتواطؤ معه أو القتال عن طريق خفض السعر بشكل كبير.

فيما يلي المكافآت لكليهما في هذه اللعبة:

أرباح السوق هي 100 بسعر الاحتكار و 0 عند دخول سعر القتال تكلف 10 أسهم تواطؤ الأرباح بالتساوي.

يمكن اكتشاف مجموعات الإستراتيجية من ترتيب الإجراءات والأحداث. إنهم {enter، stay out} للمشتركين و {collude في حالة حدوث دخول ، قتال في حالة حدوث الإدخال} للشركة الكبيرة. تحتوي اللعبة على توازن ناش اثنين الموضح في الوجه الغامق (الدخول ، التواطؤ) و (الابتعاد ، القتال). التوازن (البقاء خارج ، قتال) ضعيف لأن كبار السن سيتواطأ في أقرب وقت بالنظر إلى أن الوافد الجديد سيبقى خارج المنزل.

بمجرد اختيار إدخال ، فإن أفضل استجابة للشركة العليا هي التواطؤ. إن التهديد بالقتال ليس ذو مصداقية ولن يتم استخدامه إلا إذا كان كبار السن يُلزم نفسه بالقتال وفي هذه الحالة لم يقاتل مطلقًا. ذلك لأن الوافد الجديد يختار البقاء خارج المنزل. التوازن (البقاء خارج ، قتال) هو ناش ولكن ليس لعبة فرعية مثالية لأنه إذا بدأت اللعبة بعد أن دخل الوافد الجديد بالفعل الأفضل. الرد هو التواطؤ. هذا لا يثبت أن التواطؤ أمر لا مفر منه في الاحتكار الثنائي ، لكن التواطؤ هو توازن الروادع- I

لنفترض أن هناك اتصالاً فعالاً بين اللاعبين ثم اللعبة سوف تتغير. الشركة الكبرى قد تخبر الوافد الجديد أن الدخول سوف يتبعه القتال. لكن الوافد الجديد سيتجاهل هذا التهديد غير الموثوق. لنفترض أن كبار السن قد يلتزم قبل الدخول في القتال ، فإن التهديد سيصبح ذا مصداقية. لعبة يمكن للاعب من خلالها الالتزام بإستراتيجية ، ثم يمكن تصميمها بطريقتين.

أولاً باعتبارها لعبة يكون فيها التوازن غير المثالي مقبولاً. ثانياً ، نفترض أنه من خلال تغيير اللعبة لاستبدال فعل كلا اللاعبين. النهج الثاني هو أفضل من الأول. هذا لأنه عادة ما يريد مصمم الأزياء السماح للاعبين بالالتزام ببعض الإجراءات وليس غيرها. يمكن للاعب القيام بذلك عن طريق تحديد ترتيب اللعب بعناية. إن السماح بالتوازن بعدم الكمال يمنع هذا التمييز وعادة ما يضاعف عدد التوازن.

كمال اللعبة الفرعية مقيِّد للغاية ولا يزال يسمح بتركيبات استراتيجية كثيرة للغاية لتكون موازنة في ألعاب المعلومات غير المتماثلة. يجب أن تبدأ اللعبة الفرعية من عقدة واحدة ويجب ألا تتقاطع مع مجموعة معلومات أي لاعب. غالبًا ما تكون اللعبة الفرعية الوحيدة التي ستكون اللعبة بأكملها وتفرض كمال اللعبة الفرعية. لا يقيد التوازن على الإطلاق.


5. ورقة مصطلح عن النظرية الشعبية:

إنها جزء من الحكمة التقليدية لنظرية اللعبة التي تهدد بعقوبات مصغرة. يمكن أن تحافظ على أي تخصيص تواطؤ منطقي فرديًا مثل توازن ناش في لعبة متكررة بلا حدود. يشار إلى الألعاب التي يلتقي فيها اللاعبون في تفاعلات استراتيجية بشكل متكرر باسم الألعاب المتكررة. لا يمكن تعيين تأليف النتيجة. ومن المعروف باسم الأسوأ. الشركة التي تتم معاقبتها تبذل أفضل ما في وسعها لتخفيف العقوبة.

في لعبة n شخص متكررة بلا حدود مع مجموعات حركة محدودة في كل تكرار أي مجموعة من الإجراءات التي لوحظت في أي عدد محدود من التكرار. إنها النتيجة الفريدة لبعض التوازن المثالي للعبة الفرعية.

يتم إعطاء الشروط الثلاثة ويتم شرحها بالتفصيل على النحو التالي:

الشرط 1:

معدل وقت الكمال هو صفر أو إيجابي وصغير بما فيه الكفاية.

الشرط 2:

احتمال انتهاء اللعبة عند أي تكرار هو صفر أو إيجابي وصغير بما فيه الكفاية و

الشرط 3:

مجموعة مجموعات المكافآت التي ، باريتو بدقة يهيمن. تشتمل مجموعات المكافآت البسيطة القصوى في الامتداد المختلط ، على أن اللعبة ذات الطول الواحد لها أبعاد n.

توضح النظرية الشعبية أن سلوكًا معينًا ينشأ في حالة توازن مثالي. لا معنى له في لعبة متكررة بلا حدود. ينطبق هذا على أي لعبة تلبي الشرط من الأول إلى الثالث الذي رأيناه في الفقرة أعلاه. إذا بقيت فترة غير محدودة من الوقت دائمًا في أي لعبة ، فيمكن العثور على طريقة تجعل اللاعب مستعدًا لمعاقبة لاعب آخر من أجل مستقبل أفضل.

حتى لو كانت العقوبة تؤذي المعاقب حاليًا ومعاقبتهم. أي فاصل زمني لانهائي من الوقت في الأهمية ؛ بالمقارنة مع اللانهاية. إن التهديد بالانتقام في المستقبل يجعل اللاعبين مستعدين لتنفيذ العقوبات اللازمة. هو المثال الأكثر عملية لوحظ في هذه الصناعة.

ظهرت النظرية الشعبية كأفضل نظرية في الاقتصاد الجزئي الحديث. إنه يعني أن أي نتائج في الألعاب المتكررة هي مفهوم حل ممكن. في ظل هذه النتيجة ، يتم تلبية شروط mini-max للاعب. تنص حالة mini-max على أن يقوم اللاعب بتقليل الخسارة القصوى المحتملة. يقال إن النتيجة تكون ممكنة إذا استوفت هذا الشرط لكل لاعب في اللعبة. أ

اللعبة المتكررة هي لعبة لا توجد فيها حركة نهائية ، لكن هناك تسلسل دائري. يجوز لكل لاعب جمع المعلومات واختيار التحركات. في الرياضيات ، يتم إقرار النظرية ومناقشتها ولكن لم يتم نشرها.

إستراتيجية الزناد القاتمة هي إستراتيجية تعاقب الخصم على أي انحراف عن بعض السلوكيات. لذلك يجب أن يكون لدى جميع لاعبي اللعبة نتيجة ممكنة. يحتاج اللاعبون فقط إلى الالتزام باستراتيجية الزناد القاتمة تقريبًا. أي انحراف عن الاستراتيجية سيؤدي إلى النتيجة المرجوة.

يعاقب إلى درجة أن أي مكاسب قام بها الشيطان بسبب الانحراف يتم إلغاؤها تمامًا. وبالتالي ، لا يوجد أي ميزة لأي لاعب على الانحراف عن الدورة التي ستخرج بالنتيجة المقصودة والتعسفية. ستتم متابعة اللعبة بالطريقة نفسها لتحقيق هذه النتيجة.

الشروط التالية مهمة لفهمنا:

شرط 1: الخصم:

نحن نعلم أنه مع خصم المكاسب الحالية من الاعتراف يتم وزنه بشكل أكبر. تؤخذ المكاسب المستقبلية من التعاون أكثر بخفة. إذا كان معدل الخصم مرتفعًا جدًا ، فستعود اللعبة تقريبًا لتصبح طلقة واحدة. Suppose the real interest rate is high then a payment next year is little better than a payment a hundred years later. Therefore next year is practically irrelevant.

Any model that relies on a large number of repetitions also relies on the discount rate not being too high. The alarming strategy imposes the heaviest possible punishment for prisoner's dilemma. For consumer goods the discount is given because short terms gains are more as compare to long term. There are more innovations possible in long term.

Condition 2: A Probability of the Game Ending:

Time preference is fairly straight forward. The assumption is that the game ends each period with probability Q. There are different examples where game ends with time. It does not make a drastic, difference if Q > 0. The probability of game ending is taken as one or it is put less than expected number of repetition. It is still behaving like a discounted game. This is because the expected number of future repetitions is always large. It is no matter how many have already occurred. We always believe that there is end of each game.

The following two situations are different of each other:

أنا. The game will end at some uncertain data before T. In statistics, it is assumed as T.

ثانيا. There is a constant probability of the game ending.

ثالثا. Under the game theory, each game is like a finite game. This is because as time passes the maximum amount of time still to run shrinks to zero, even though the game will probably end T. If it lasts until T, the game looks exactly the same as at time zero.

Condition 3: The Dimensionality Condition:

The mini-max payoff is the payoff of the result. Suppose all the other players pick strategies solely to punish players i then he protects himself as best he can. There are different methods of risk diversions. The dimensionality condition is need for games with three or more dimension. It is satisfied if for each game which has same payoff. The desired behavior requires some way to the other players to punish a deviator, without punishing themselves. It is observed in terms of different dimensions in game.


 

ترك تعليقك