يرجى مراجعة هذه المقالة وإزالة وسم المقالات غير المراجعة، ووسمها بوسوم الصيانة المناسبة.

نموذج الخليط

من أرابيكا، الموسوعة الحرة
اذهب إلى التنقل اذهب إلى البحث
نموذج الخليط

في الإحصائيات، يعد نموذج الخليط نموذجًا احتماليًا لتمثيل وجود مجموعات سكانية فرعية ضمن إجمالي عدد السكان، دون تحديد أي من مجموعة البيانات التي تمت ملاحظتها هي المجموعة الفرعية التي تنتمي إليها الملاحظات الفردية. يتطابق نموذج الخليط كلياً مع توزيع الخليط الذي يمثل التوزيع الاحتمالي للتدقيقات في إجمالي السكان. ولذلك، في حين أن المشكلات المتعلقة بـ «توزيعات المزيج» ترتبط باشتقاق مميزات إجمالي السكان من تلك الخاصة بالسكان الفرعيين، فإن «نماذج المزيج» يعد مناسباً لإجراء استنتاجات إحصائية حول خصائص المجموعات الفرعية مع الأخذ بعين الاعتبار من الملاحظات فقط على تجمع السكان، دون معلومات هوية السكان الفرعية.

تتضمن بعض طرق تنفيذ نماذج المزيج بعض خطوات التي تُنسب إلى هويات السكان الفرعية المفترضة إلى الملاحظات الفردية (أو الأوزان تجاه هذه الفئات الفرعية)، وفي هذه الحالة يجب اعتبارها أنواعًا من أنواع التعلم الغير خاضع للرقابة أو إجراءات التجميع. ولذاك، لا تنطوي جميع إجراءات الاستدلال على مثل هذه الخطوات.

لا يجب الخط بين النوذج اخليطي والبيانات التركيبية، أي تلك البيانات التي تكون مقيدة (1، 100٪، إلخ.). لذلك، يمكن اعتبارهم جميعا نماذج مختلطة، حيث يتم أخذ عينات من السكان بشكل عشوائي. على العكس من ذلك، يمكن اعتبار نماذج الخليط كنماذج تركيبية، حيث تم تطبيع إجمالي حجم القراءة إلى 1.

بناء

نموذج الخليط العام

نموذج الخلط ذو الأبعاد المحدودة النموذجية هو نموذج هرمي يتكون من المكونات التالية:

  • N المتغيرات العشوائية التي يتم ملاحظتها، يتم توزيع كل منها وفقًا لمزيج من مكونات K ، مع المكونات التي تنتمي إلى نفس المجموعة البارامترية للتوزيع (على سبيل المثال، كل عادي، كل Zipfian ، وما إلى ذلك) ولكن مع معلمات مختلفة
  • N المتغيرات الكامنة العشوائية التي تحدد هوية مكون الخليط لكل ملاحظة، يتم توزيع كل منها وفقًا لتوزيع فئوي الأبعاد K
  • مجموعة من أوزان خليط K ، وهي احتمالات تساوي 1.
  • مجموعة من معلمات K ، تحدد كل منها معلمة مكون الخليط المقابل. في كثير من الحالات، تكون كل «معلمة» في الواقع مجموعة من المعلمات. على سبيل المثال، إذا كانت مكونات الخليط هي توزيعات غوسية، فسيكون هناك متوسط وتباين لكل مكون. إذا كانت مكونات الخليط عبارة عن توزيعات فئوية (على سبيل المثال، عندما تكون كل ملاحظة رمزية من أبجدية محدودة بحجم V)، فسيكون هناك ناقل احتمالات V يلخص إلى 1.

بالإضافة إلى ذلك، في إعداد بايزي، فإن أوزان ومعلمات الخليط ستكون نفسها متغيرات عشوائية، وسيتم وضع التوزيعات السابقة على المتغيرات. في مثل هذه الحالة، يُنظر إلى الأوزان عادةً على أنها متجه عشوائي ذو أبعاد K مستمد من توزيع Dirichlet (اقتران سابق للتوزيع القاطع)، وسيتم توزيع المعلمات وفقًا للتصاميم المتقاربة الخاصة بها.

رياضيا، يمكن وصف نموذج الخليط المعلمي الأساسي على النحو التالي:

K=number of mixture componentsN=number of observationsθi=1K=parameter of distribution of observation associated with component iϕi=1K=mixture weight, i.e., prior probability of a particular component iϕ=K-dimensional vector composed of all the individual ϕ1K; must sum to 1zi=1N=component of observation ixi=1N=observation iF(x|θ)=probability distribution of an observation, parametrized on θzi=1NCategorical(ϕ)xi=1N|zi=1NF(θzi)
K,N=as aboveθi=1K,ϕi=1K,ϕ=as abovezi=1N,xi=1N,F(x|θ)=as aboveα=shared hyperparameter for component parametersβ=shared hyperparameter for mixture weightsH(θ|α)=prior probability distribution of component parameters, parametrized on αθi=1KH(θ|α)ϕSymmetricDirichletK(β)zi=1N|ϕCategorical(ϕ)xi=1N|zi=1N,θi=1KF(θzi)

يستخدم هذا التوصيف F و H لوصف التوزيعات التعسفية على الملاحظات والمعلمات، على التوالي. عادةً ما يكون H هو المرافقة السابقة لـ F. الخياران الأكثر شيوعًا لـ F هما Gaussian المعروف أيضًا باسم «طبيعي» (للملاحظات ذات القيمة الحقيقية) والفئات (للملاحظات المنفصلة). الاحتمالات الشائعة الأخرى لتوزيع مكونات الخليط هي:

  • التوزيع ذو الحدين، لعدد «الوقائع الإيجابية» (على سبيل المثال، النجاحات، نعم الأصوات، إلخ) بالنظر إلى عدد ثابت من إجمالي الوقائع
  • التوزيع متعدد الحدود، مشابه للتوزيع ذي الحدين، ولكن بالنسبة لعدد التكرارات متعددة الطرق (على سبيل المثال، نعم / لا / ربما في استطلاع)
  • التوزيع السلبي ذي الحدين، للملاحظات من النوع ذي الحدين ولكن عندما تكون كمية الاهتمام هي عدد حالات الفشل قبل حدوث عدد معين من حالات النجاح
  • توزيع بواسون، لعدد مرات وقوع حدث في فترة زمنية معينة، لحدث يتميز بمعدل ثابت من الحدوث
  • التوزيع الأسي، للوقت الذي يسبق الحدث التالي، لحدث يتميز بمعدل ثابت من الحدوث
  • توزيع لوغاريتمي عادي، للأرقام الحقيقية الموجبة التي يفترض أن تنمو بشكل كبير، مثل الدخول أو الأسعار
  • التوزيع الطبيعي متعدد المتغيرات (المعروف أيضًا باسم التوزيع الغوسي متعدد المتغيرات)، لناقلات النتائج المترابطة التي يتم توزيعها بشكل فردي
  • التوزيع متعدد المتغيرات للطلاب (المعروف أيضًا باسم التوزيع المتعدد المتغيرات)، لناقلات النتائج ذات الذيل الثقيل ذات الصلة [1]
  • متجه لقيم Bernoulli الموزعة، المقابلة، على سبيل المثال، لصورة بالأبيض والأسود، مع كل قيمة تمثل بكسل؛ راجع مثال التعرّف على خط اليد أدناه

أمثلة محددة

نموذج الخليط الغوسي

نموذج خليط غاوسي غير بايزي باستخدام تدوين اللوحة. تشير المربعات الصغيرة إلى معلمات ثابتة؛ تشير الدوائر الأكبر إلى متغيرات عشوائية. تشير الأشكال المملوءة إلى القيم المعروفة. تشير الإشارة [K] إلى متجه الحجم K.
K,N=as aboveϕi=1K,ϕ=as abovezi=1N,xi=1N=as aboveθi=1K={μi=1K,σi=1K2}μi=1K=mean of component iσi=1K2=variance of component izi=1NCategorical(ϕ)xi=1N𝒩(μzi,σzi2)
نموذج الخليط الغازي بايزي باستخدام تدوين اللوحة. تشير المربعات الصغيرة إلى معلمات ثابتة؛ تشير الدوائر الأكبر إلى متغيرات عشوائية. تشير الأشكال المملوءة إلى القيم المعروفة. تشير الإشارة [K] إلى متجه الحجم K.

نسخة بايزي لنموذج خليط غوسي هي كما يلي:

K,N=as aboveϕi=1K,ϕ=as abovezi=1N,xi=1N=as aboveθi=1K={μi=1K,σi=1K2}μi=1K=mean of component iσi=1K2=variance of component iμ0,λ,ν,σ02=shared hyperparametersμi=1K𝒩(μ0,λσi2)σi=1K2InverseGamma(ν,σ02)ϕSymmetricDirichletK(β)zi=1NCategorical(ϕ)xi=1N𝒩(μzi,σzi2)

عادة ما يتم توسيع نموذج الخليط الغازي بايزي لتناسب ناقلًا لمعلمات غير معروفة (يشار إليها بخط غامق)، أو توزيعات عادية متعددة المتغيرات. في توزيع متعدد المتغيرات (أي نمذجة متجه واحد x مع المتغيرات العشوائية N) يمكن للمرء أن يصمم متجهًا للمعلمات (مثل عدة ملاحظات لإشارة أو بقع داخل صورة) باستخدام نموذج خليط غوسي التوزيع المسبق على متجه التقديرات المقدمة من

p(θ)=i=1Kϕi𝒩(μi,Σi)

حيث يتميز مكون المتجه الأول بتوزيعات عادية مع الأوزان ϕi ، يعني μi ومصفوفات التباين المشترك Σi . لدمج هذا مسبقًا في تقدير بايزي، يتم ضرب السابق في التوزيع المعروف p(x|θ) من البيانات x مشروطة على المعلمات θ ليتم تقديرها. مع هذه الصيغة، التوزيع الخلفي p(θ|x) هو أيضًا نموذج خليط غوسي من النموذج

مع معلمات جديدة ϕi~,μi~ و Σi~ التي يتم تحديثها باستخدام خوارزمية EM.[2] على الرغم من أن تحديثات المعلمات المستندة إلى EM راسخة جيدًا، إلا أن تقديم التقديرات الأولية لهذه المعلمات يعد حاليًا مجالًا للبحث النشط. لاحظ أن هذه الصيغة تعطي حلًا مغلقًا للتوزيع الخلفي الكامل. تقديرات المتغير العشوائي θ يمكن الحصول عليها عبر أحد المُقدِّرين العديدين، مثل متوسط التوزيع الخلفي أو الحد الأقصى له.

مثل هذه التوزيعات مفيدة لافتراض أشكال الصور والمجموعات، على سبيل المثال. في حالة تمثيل الصورة، يمكن إمالة كل غوسي وتوسيعه وتشويهه وفقًا لمصفوفات التغاير Σi . يتناسب توزيع غوسي واحد للمجموعة مع كل رقعة (عادة بحجم 8 × 8 بكسل) في الصورة. والجدير بالذكر أن أي توزيع للنقاط حول مجموعة (انظر k- يعني) قد يتم إعطاؤه بدقة مكونات غوسية كافية، ولكن نادرًا ما تكون هناك حاجة إلى مكونات K = 20 لوضع نموذج لتوزيع صورة أو مجموعة بيانات بدقة.

نموذج خليط قاطع

نموذج خليط قاطع غير بايزي باستخدام تدوين اللوحة. تشير المربعات الصغيرة إلى معلمات ثابتة؛ تشير الدوائر الأكبر إلى متغيرات عشوائية. تشير الأشكال المملوءة إلى القيم المعروفة. تشير الإشارة [K] إلى متجه الحجم K ؛ وبالمثل ل [V].
  • K,N: على النحو الوارد أعلاه
  • ϕi=1K,ϕ: على النحو الوارد أعلاه
  • zi=1N,xi=1N: على النحو الوارد أعلاه
  • V: أبعاد الملاحظات الفئوية، على سبيل المثال، حجم مفردات الكلمات
  • θi=1K,j=1V: احتمالية المكون i بند المراقبة j
  • θi=1K: متجه البعد V, تتكون من θi,1V; يجب أن يساوي 1

المتغيرات العشوائية:

zi=1NCategorical(ϕ)xi=1NCategorical(θzi)
نموذج خليط بيزي الفصلي باستخدام تدوين اللوحة. تشير المربعات الصغيرة إلى معلمات ثابتة؛ تشير الدوائر الأكبر إلى متغيرات عشوائية. تشير الأشكال المملوءة إلى القيم المعروفة. تشير الإشارة [K] إلى متجه الحجم K ؛ وبالمثل ل [V].

يبدو نموذج الخليط البايزي النموذجي مع الملاحظات الفئوية كما يلي:

  • K,N: على النحو الوارد أعلاه
  • ϕi=1K,ϕ: على النحو الوارد أعلاه
  • zi=1N,xi=1N: على النحو الوارد أعلاه
  • V: أبعاد الملاحظات الفئوية، على سبيل المثال، حجم مفردات الكلمات
  • θi=1K,j=1V: احتمالية المكون i بند المراقبة j
  • θi=1K: متجه البعد V, تتكون من θi,1V; يجب أن يساوي 1
  • α: تقاسم فرط التركيز θ لكل مكون
  • β: فرط تركيز ϕ
ϕSymmetricDirichletK(β)θi=1KSymmetric-DirichletV(α)zi=1NCategorical(ϕ)xi=1NCategorical(θzi)

أمثلة

نموذج مالي

يتم رسم التوزيع الطبيعي باستخدام وسائل مختلفة والتباينات

غالبًا ما تتصرف العوائد المالية بشكل مختلف في المواقف العادية وأثناء أوقات الأزمات. يبدو أن نموذج الخليط [3] للبيانات المرتجعة معقول. في بعض الأحيان يكون النموذج المستخدم عبارة عن نموذج للانتشار السريع، أو كخليط من توزيعين عاديين. انظر علم الاقتصاد المالي # التحديات والنقد لمزيد من السياق.

أسعار المنزل

نفترض أننا نلاحظ أسعار N منازل مختلفة. أنواع مختلفة من المنازل في أحياء مختلفة سيكون لها أسعار مختلفة إلى حد كبير، ولكن سعر نوع معين من المنازل في حي معين (على سبيل المثال، منزل مكون من ثلاث غرف نوم في حي راقي باعتدال) يميل إلى التجمع عن كثب تقريبًا حول المتوسط. قد يكون أحد النماذج المحتملة لهذه الأسعار هو افتراض أن الأسعار موصوفة بدقة من خلال نموذج مزيج بمكونات K مختلفة، يتم توزيع كل منها كتوزيع عادي بمتوسط وتباين غير معروفين، مع تحديد كل مكون لمجموعة معينة من نوع المنزل / الحي. إن ملاءمة هذا النموذج للأسعار المرصودة، على سبيل المثال، باستخدام خوارزمية التوقع إلى أقصى حد، يميل إلى تجميع الأسعار وفقًا لنوع / حي المنزل وكشف انتشار الأسعار في كل نوع / حي. (لاحظ أنه بالنسبة لقيم مثل الأسعار أو الدخول المضمونة بأنها إيجابية والتي تميل إلى النمو بشكل كبير، قد يكون التوزيع اللوغاريتمي الطبيعي في الواقع نموذجًا أفضل من التوزيع العادي.)

الموضوعات في المستند

افترض أن الوثيقة تتكون من N كلمات مختلفة من إجمالي مفردات الحجم V ، حيث تتوافق كل كلمة مع أحد الموضوعات المحتملة K. توزيع مثل هذه الكلمات يمكن أن تكون على غرار على شكل مزيج من K مختلفة V الابعاد توزيعات القاطع . عادة ما يطلق على نموذج من هذا النوع نموذج موضوع . لاحظ أن زيادة التوقعات المطبقة على مثل هذا النموذج ستفشل عادةً في تحقيق نتائج واقعية، ويرجع ذلك (من بين أمور أخرى) إلى العدد المفرط من المعلمات . عادة ما تكون بعض أنواع الافتراضات الإضافية ضرورية للحصول على نتائج جيدة. عادة يتم إضافة نوعين من المكونات الإضافية إلى النموذج:

مراجع

  1. ^ Sotirios P. Chatzis, Dimitrios I. Kosmopoulos, Theodora A. Varvarigou, "Signal Modeling and Classification Using a Robust Latent Space Model Based on t Distributions," IEEE Transactions on Signal Processing, vol. 56, no. 3, pp. 949–963, March 2008.
  2. ^ Yu، Guoshen (2012). "Solving Inverse Problems with Piecewise Linear Estimators: From Gaussian Mixture Models to Structured Sparsity". IEEE Transactions on Image Processing. ج. 21 ع. 5: 2481–2499. arXiv:1006.3056. Bibcode:2012ITIP...21.2481G. DOI:10.1109/tip.2011.2176743. PMID:22180506.
  3. ^ Dinov, ID. "Expectation Maximization and Mixture Modeling Tutorial". California Digital Library, Statistics Online Computational Resource, Paper EM_MM, http://repositories.cdlib.org/socr/EM_MM, December 9, 2008 نسخة محفوظة 8 أبريل 2020 على موقع واي باك مشين.