إشعار: ستقوم مجموعة الاستشارات الإحصائية إدر بترحيل الموقع إلى نظام إدارة المحتوى في وردبريس في فبراير لتسهيل الصيانة وإنشاء محتوى جديد. ستتم إزالة بعض صفحاتنا القديمة أو وضعها في الأرشيف بحيث لا يتم الاحتفاظ بها بعد الآن. سنحاول الحفاظ على عمليات إعادة التوجيه بحيث تستمر عناوين ورل القديمة في العمل بأفضل ما في وسعنا. مرحبا بكم في معهد للبحوث الرقمية والتعليم مساعدة المجموعة الاستشارية ستات من خلال إعطاء هدية ستاتا المشروح تحليل عامل الانتاج تظهر هذه الصفحة مثال تحليل عامل مع الحواشي السفلية شرح الإخراج. سوف نقوم محاور رئيسية متكررة (الخيار إب) مع سمك كما الطائفية الأولية الاحتفاظ ثلاثة عوامل (عامل (3) الخيار) تليها فاريماكس و بروماكس التناوب. وقد جمعت هذه البيانات عن 1428 طالبا جامعيا (بيانات كاملة عن 1365 ملاحظة) وهي ردود على العناصر في المسح. وسوف نستخدم البند 13 خلال البند 24 في تحليلنا. ا. إيجنفالو: القيمة الذاتية هي تباين العامل. في حل العامل الأولي، فإن العامل الأول سوف يمثل أكبر التباين، والثاني سوف تمثل أعلى كمية المقبل من التباين، وهلم جرا. بعض من القيم الذاتية هي سلبية لأن المصفوفة ليست من رتبة كاملة، وهذا هو، على الرغم من أن هناك 12 متغيرات الأبعاد من الفضاء عامل أقل بكثير هناك على الأكثر سبعة عوامل ممكنة. ب. الفرق: يعطي الاختلافات بين القيمة الذاتية الحالية و التالية. ج. النسبة: يعطي نسبة التباين التي يمثلها العامل. د. التراكمي: يعطي النسبة التراكمية من التباين التي يمثلها هذا العامل بالإضافة إلى كل ما سبق. ه. تحميل العوامل: تمثل عوامل تحميل هذا المحلول المتعامد كيف يتم ترجيح المتغيرات لكل عامل ولكن أيضا العلاقة بين المتغيرات والعامل. F. التفرد: يعطي نسبة التباين المشترك للمتغير غير المرتبط بالعوامل. التفرد يساوي 1 - الترابية. ز. تحمیل العامل المتناوب: یشکل تحمیل العامل للدوران المتعامد فارماکس کلا من کیفیة ترجیح المتغیرات لکل عامل ولکن أیضا العلاقة بین المتغیرات والعامل. ويحاول التناوب فاريماكس لتحقيق أقصى قدر من التحميلات التربيعية من الأعمدة. ح. التفرد: نفس القيم كما في e. أعلاه لأنه لا يزال حل عامل ثلاثة. يعرض خيار الفراغات عامل تحميل فقط أكبر من قيمة محددة (قل 0.3). أنا. تحليلات عامل الدوران: تمثل عوامل تحميل دوران المائل بروماكس كيف يتم ترجيح كل من المتغيرات لكل عامل. ملاحظة: هذه ليست ارتباطات بين المتغيرات والعوامل. دوران بروماكس يسمح للعوامل أن تكون مرتبطة في محاولة لتقريب بنية بسيطة بشكل أفضل. أنا. التفرد: نفس القيم كما في e. و h. أعلاه لأنه لا يزال حل عامل ثلاثة. الأمر المشترك إستات هو أمر بوستستيماشيون الذي يعرض الارتباط بين عوامل دوران منحرف. محتوى هذا الموقع لا ينبغي أن يفسر على أنه تأييد لأي موقع ويب معين أو كتاب أو منتج برامج من قبل جامعة كاليفورنيا. ملاحظة: سوف تقوم مجموعة الاستشارات الإحصائية إدر بترحيل الموقع إلى نظام إدارة محتوى وردبريس في فبراير لتسهيل صيانة وإنشاء محتوى جديد. ستتم إزالة بعض صفحاتنا القديمة أو وضعها في الأرشيف بحيث لا يتم الاحتفاظ بها بعد الآن. سنحاول الحفاظ على عمليات إعادة التوجيه بحيث تستمر عناوين ورل القديمة في العمل بأفضل ما في وسعنا. مرحبا بكم في معهد البحوث والتعليم الرقمي مساعدة مجموعة الاستشارات الاستشارية من خلال إعطاء هدية ما التحليل الإحصائي يجب استخدام التحليلات الإحصائية باستخدام ستاتا معلومات الإصدار: تم اختبار رمز لهذه الصفحة في ستاتا 12. مقدمة تعرض هذه الصفحة كيفية تنفيذ عدد من الاختبارات الإحصائية باستخدام ستاتا. يقدم كل قسم وصفا موجزا للهدف من الاختبار الإحصائي، عندما يتم استخدامه، مثال يوضح أوامر ستاتا وإخراج ستاتا مع تفسير موجز للناتج. يمكنك مشاهدة الصفحة اختيار الاختبار الإحصائي الصحيح لجدول يعرض لمحة عامة عن كل اختبار مناسب للاستخدام. عند تحديد أي اختبار مناسب للاستخدام، من المهم النظر في نوع المتغيرات التي لديك (أي ما إذا كانت المتغيرات الخاصة بك فئوية أو ترتيبية أو فاصلة، وما إذا كانت توزع عادة)، انظر ما هو الفرق بين الفئوية والترابية و المتغيرات الفاصلة لمزيد من المعلومات حول هذا الموضوع. حول ملف البيانات هسب معظم الأمثلة في هذه الصفحة سوف تستخدم ملف بيانات يسمى hsb2، المدرسة الثانوية وخارجها. يحتوي ملف البيانات هذا على 200 ملاحظة من عينة من طلاب المدارس الثانوية مع معلومات ديموغرافية عن الطلاب، مثل جنسهم (أنثى)، والوضع الاجتماعي والاقتصادي (سيس) والخلفية العرقية (العرق). كما أنه يحتوي على عدد من الدرجات على الاختبارات الموحدة، بما في ذلك اختبارات القراءة (القراءة) والكتابة (الكتابة) والرياضيات (الرياضيات) والدراسات الاجتماعية (سوست). يمكنك الحصول على ملف البيانات hsb2 من داخل ستاتا عن طريق كتابة: عينة واحدة تي اختبار اختبار واحد عينة تي يسمح لنا لاختبار ما إذا كان متوسط عينة (لمتغير فاصل موزعة عادة) يختلف كثيرا عن قيمة افتراضية. على سبيل المثال، باستخدام ملف البيانات hsb2. نقول أننا نرغب في اختبار ما إذا كان متوسط درجة الكتابة (الكتابة) يختلف كثيرا عن 50. يمكننا القيام بذلك كما هو موضح أدناه. ومتوسط الكتابة المتغيرة لهذه العينة الخاصة من الطلبة هو 52.775، وهذا يختلف إحصائيا عن قيمة الاختبار 50. نخلص إلى أن هذه المجموعة من الطلبة لها متوسط أعلى بكثير في اختبار الكتابة من 50. عينة واحدة متوسطة اختبار يتيح لنا اختبار متوسط عينة واحد اختبار ما إذا كان متوسط العينة يختلف كثيرا عن القيمة المفترضة. سوف نستخدم نفس المتغير، الكتابة. كما فعلنا في مثال عينة تي اختبار واحد أعلاه، ولكن نحن لسنا بحاجة إلى افتراض أنه هو الفاصل وتوزيعها عادة (نحن بحاجة فقط إلى افتراض أن الكتابة هي متغير ترتيبي وأن توزيعه متماثل). سنقوم باختبار ما إذا كانت درجة الكتابة المتوسطة (الكتابة) تختلف بشكل كبير عن 50. تشير النتائج إلى أن متوسط الكتابة المتغيرة لهذه المجموعة يختلف إحصائيا عن 50. اختبار ذو الحدين يسمح لنا اختبار واحد ذو عينة ثنائية اختبار ما إذا كانت النسبة من النجاحات على متغير مستقل فئوي يعتمد على مستويين يختلف كثيرا عن القيمة المفترضة. على سبيل المثال، باستخدام ملف البيانات hsb2. نقول إننا نرغب في اختبار ما إذا كانت نسبة الإناث (الإناث) تختلف اختلافا كبيرا عن 50، أي من 5. يمكننا القيام بذلك كما هو مبين أدناه. تشير النتائج إلى عدم وجود فروق ذات دلالة إحصائية (p. 2292). وبعبارة أخرى، فإن نسبة الإناث لا تختلف اختلافا كبيرا عن القيمة المفترضة من 50. تشي مربع الخير من صالح خير مربع تشي اختبار مناسبا يسمح لنا لاختبار ما إذا كانت النسب الملحوظة لمتغير فئوية تختلف من النسب المفترضة. على سبيل المثال، دعونا نفترض أننا نعتقد أن عامة السكان يتكون من 10 الإسباني، 10 الآسيوية، 10 الأمريكيين الأفارقة و 70 الناس البيض. نحن نريد أن نختبر ما إذا كانت النسب الملحوظة من عينتنا تختلف اختلافا كبيرا عن هذه النسب المفترضة. لإجراء الخير تشي مربع من اختبار صالح، تحتاج إلى أولا تحميل برنامج كسغوف الذي ينفذ هذا الاختبار. يمكنك تحميل كسغوف من داخل ستاتا بكتابة فينديت كسغوف (انظر كيف يمكنني استخدام الأمر فينديت للبحث عن البرامج والحصول على مساعدة إضافية لمزيد من المعلومات حول استخدام فينديت). الآن بعد أن تم تثبيت برنامج كسغوف، يمكننا استخدامه من خلال كتابة: تظهر هذه النتائج أن التكوين العنصري في عينتنا لا تختلف اختلافا كبيرا عن القيم المفترضة التي زودنا بها (تشي مربع مع ثلاث درجات من الحرية 5.03، ص 1697) . اثنان من العينات المستقلة اختبار t يتم استخدام عينات مستقلة اختبار t عندما تريد مقارنة وسائل متغير يعتمد عادة الفاصل الزمني يعتمد على مجموعتين مستقلتين. على سبيل المثال، باستخدام ملف البيانات hsb2. نقول أننا نرغب في اختبار ما إذا كان المتوسط للكتابة هو نفسه بالنسبة للذكور والإناث. تشير النتائج إلى وجود فروق ذات دلالة إحصائية بين متوسط درجات الكتابة للذكور والإناث (t -3.7341، p0002). وبعبارة أخرى، فإن الإناث لديهم درجة أعلى إحصائيا أعلى بكثير من الكتابة (54.99) من الذكور (50.12). اختبار ويلكوكسون-مان-ويتني اختبار ويلكوكسون-مان-ويتني هو اختبار غير معلمي لعينات t المستقلة، ويمكن استخدامه عندما لا تفترض أن المتغير التابع هو متغير فاصل موزعة عادة (أنت تفترض فقط أن المتغير هو على الأقل ترتيبي). ستلاحظ أن بناء الجملة ستاتا لاختبار ويلكوكسون-مان-ويتني يكاد يكون متطابقا مع اختبار العينات المستقلة t. سوف نستخدم ملف البيانات نفسه (ملف البيانات hsb2) والمتغيرات نفسها في هذا المثال كما فعلنا في المثال t الاختبار السابق، ولن نفترض أن الكتابة. المتغير التابع لدينا، موزعة عادة. تشير النتائج إلى وجود فروق ذات دلالة إحصائية بين التوزيعات الأساسية لدرجات الكتابة للذكور ودرجات الكتابة للإناث (z -3.329، p 0.0009). يمكنك تحديد المجموعة التي لديها مرتبة أعلى من خلال النظر في كيفية الرتبة الفعلية مبالغ مقارنة لمبالغ رتبة المتوقعة تحت فرضية نول. وكان مجموع صفوف الإناث أعلى بينما كان مجموع صفوف الذكور أقل. وهكذا كانت الفئة النسائية أعلى رتبة. اختبار مربع تشي يستخدم اختبار مربع تشي عندما تريد معرفة ما إذا كانت هناك علاقة بين متغيرين فئويين. في ستاتا، يتم استخدام الخيار chi2 مع الأمر تابولات للحصول على إحصائية الاختبار والقيمة p المرتبطة بها. استخدام ملف البيانات hsb2. يتيح معرفة ما إذا كان هناك علاقة بين نوع المدرسة التي حضرها (ششتيب) والطلاب جنس (أنثى). تذكر أن اختبار تشي مربع يفترض القيمة المتوقعة من كل خلية خمسة أو أعلى. ويمكن الوفاء بهذا الافتراض بسهولة في الأمثلة أدناه. ومع ذلك، إذا لم يتم استيفاء هذا الافتراض في البيانات الخاصة بك، يرجى الاطلاع على قسم عن الصيادين الاختبار الدقيق أدناه. وتشير هذه النتائج إلى عدم وجود علاقة ذات دلالة إحصائية بين نوع المدرسة التي تم حضورها ونوع الجنس (مربع مربع مع درجة واحدة من الحرية 0.0470، ص 0.828). دعونا ننظر إلى مثال آخر، وهذه المرة النظر في العلاقة بين الجنسين (الإناث) والوضع الاجتماعي والاقتصادي (سيس). نقطة هذا المثال هي أن متغير واحد (أو كلاهما) قد يكون أكثر من مستويين، وأن المتغيرات لا يجب أن يكون لها نفس عدد المستويات. في هذا المثال، الإناث لديها مستويين (ذكور وإناث)، سيس لديها ثلاثة مستويات (منخفضة ومتوسطة وعالية). مرة أخرى نجد أنه لا توجد علاقة ذات دلالة إحصائية بين المتغيرات (تشي مربع مع درجتين من الحرية 4.5765، ص 0.101). اختبار الصيادين الدقيق يستخدم اختبار الصيادين الدقيق عندما تريد إجراء اختبار مربع مربع، ولكن واحد أو أكثر من الخلايا لديه تردد متوقع من خمسة أو أقل. تذكر أن اختبار مربع تشي يفترض أن كل خلية لديها تردد متوقع من خمسة أو أكثر، ولكن الاختبار الدقيق للصيادين لا يوجد لديه مثل هذا الافتراض ويمكن استخدامها بغض النظر عن مدى صغر التردد المتوقع. في المثال أدناه، لدينا خلايا ذات ترددات ملحوظة من اثنين و واحد، مما قد يشير إلى الترددات المتوقعة التي يمكن أن تكون أقل من خمسة، لذلك سوف نستخدم فيشرز الاختبار الدقيق مع الخيار المحدد في الأمر جدول. وتشير هذه النتائج إلى عدم وجود علاقة ذات دلالة إحصائية بين العرق ونوع المدرسة (ص 0.597). لاحظ أن الاختبار الدقيق للصيادين ليس لديهم كوتيست ستاتيستكوت، ولكن يحسب قيمة p مباشرة. في اتجاه واحد أنوفا يتم استخدام تحليل التباين في اتجاه واحد (أنوفا) عندما يكون لديك متغير مستقل كاتيغوريكال (مع اثنين أو أكثر من الفئات) ومتغير يعتمد عادة الفاصل الزمني وترغب في اختبار الاختلافات في وسائل الاعتماد متغير موزعة حسب مستويات المتغير المستقل. على سبيل المثال، باستخدام ملف البيانات hsb2. نقول أننا نرغب في اختبار ما إذا كان متوسط الكتابة يختلف بين أنواع البرامج الثلاثة (بروج). ويكون الأمر لهذا الاختبار: متوسط المتغير التابع يختلف اختلافا كبيرا بين مستويات نوع البرنامج. ومع ذلك، نحن لا نعرف ما إذا كان الفرق بين اثنين فقط من المستويات أو كل ثلاثة مستويات. (اختبار F للنموذج هو نفسه اختبار F ل بروغ لأن بروغ كان المتغير الوحيد الذي تم إدخاله في النموذج، وإذا تم إدخال متغيرات أخرى أيضا، فإن اختبار F للنموذج قد يكون مختلفا عن بروغ.) إلى انظر متوسط الكتابة لكل مستوى من نوع البرنامج، يمكنك استخدام الأمر تابولات مع خيار تلخيص، كما هو موضح أدناه. من هذا يمكننا أن نرى أن الطلاب في البرنامج الأكاديمي لديهم أعلى درجة الكتابة المتوسطة، في حين أن الطلاب في البرنامج المهني لديها أدنى. كروسكال واليس اختبار يستخدم اختبار كروسكال واليس عندما يكون لديك متغير مستقل واحد مع اثنين أو أكثر من المستويات ومتغير تعتمد ترتيبي. وبعبارة أخرى، هو الإصدار غير المعلمي من أنوفا وشكل عام من طريقة اختبار مان ويتني لأنه يسمح 2 أو أكثر من المجموعات. سنستخدم نفس ملف البيانات كمثال أنوفا مثال واحد أعلاه (ملف البيانات hsb2) ونفس المتغيرات كما في المثال أعلاه، لكننا لن نفترض أن الكتابة هي متغير فاصل موزعة بشكل طبيعي. إذا حصلت بعض الدرجات على رتب مرتبطة، ثم يتم استخدام عامل تصحيح، مما يؤدي إلى قيمة مختلفة قليلا من تشي مربع. مع أو بدون علاقات، تشير النتائج إلى وجود فرق ذو دلالة إحصائية بين النوع الثالث من البرامج. اختبار t المقترن يتم استخدام اختبار t (اختبار) مقترن عندما يكون لديك ملاحظتان ذات صلة (أي ملاحظتين لكل موضوع) وترغب في معرفة ما إذا كانت الوسائل على هذين المتغيرين الفاصلين موزعة بشكل طبيعي تختلف عن بعضها البعض. على سبيل المثال، باستخدام ملف البيانات hsb2 سوف نقوم باختبار ما إذا كان متوسط القراءة يساوي متوسط الكتابة. تشير هذه النتائج إلى أن متوسط القراءة لا يختلف إحصائيا عن متوسط الكتابة (t -0.8673، p 0.3868). ويلكوكسون وقعت اختبار مجموع رتبة ولكوكسون وقعت اختبار مجموع رتبة هو إصدار غير المعلمي من عينات اقتران اختبار t. يمكنك استخدام اختبار مبلغ رتبة ويلكوكسون الموقعة عندما لا ترغب في افتراض أن الفرق بين المتغيرين هو فاصل زمني ويتم توزيعه عادة (ولكنك تفترض أن الفرق هو ترتيبي). سنستخدم نفس المثال الوارد أعلاه، ولكننا لن نفترض أن الفرق بين القراءة والكتابة هو الفاصل الزمني وتوزيعها عادة. وتشير النتائج إلى أنه لا يوجد فرق ذو دلالة إحصائية بين القراءة والكتابة. إذا كنت تعتقد أن الاختلافات بين القراءة والكتابة لم تكن ترتيبية ولكن يمكن تصنيفها فقط على أنها إيجابية وسلبية، فقد ترغب في النظر في اختبار علامة بدلا من اختبار رتبة علامة. مرة أخرى، سوف نستخدم نفس المتغيرات في هذا المثال ونفترض أن هذا الاختلاف غير ترتيبي. هذا الإخراج يعطي كلا من الاختبارات من جانب واحد وكذلك اختبار من جانبين. على افتراض أننا كنا نبحث عن أي فرق، ونحن سوف تستخدم اختبار من جانبين واستنتج أنه لم يتم العثور على فرق ذو دلالة إحصائية (p.5565). منيمار اختبار كنت قد إجراء اختبار منيمارز إذا كنت مهتما في الترددات الهامشية من اثنين من النتائج الثنائية. قد تكون هذه النتائج الثنائية نفس متغير النتيجة على أزواج مطابقة (مثل دراسة حالة السيطرة) أو متغيرين نتيجة من مجموعة واحدة. على سبيل المثال، دعونا ننظر في سؤالين، Q1 و Q2، من اختبار أخذت من قبل 200 طالب. لنفترض أن 172 طالبا أجابوا على كلا السؤالين بشكل صحيح، أجاب 15 طالبا على كلا السؤالين بشكل غير صحيح، 7 أجابوا Q1 بشكل صحيح و Q2 بشكل غير صحيح، و 6 أجابوا Q2 بشكل صحيح و Q1 بشكل غير صحيح. ويمكن النظر في هذه التعدادات في جدول طوارئ ذي اتجاهين. الفرضية الباطلة هي أن يتم الرد على السؤالين بشكل صحيح أو بشكل غير صحيح بنفس المعدل (أو أن جدول الطوارئ متماثل). يمكننا إدخال هذه التهم إلى ستاتا باستخدام مسي. وهو أمر من جداول علم الأوبئة ستاتاس. يتم تصنيف النتيجة وفقا لاتفاقيات دراسة الحالة. تشير إحصائيات مكنيمار تشي مربع إلى أنه لا يوجد فرق ذو دلالة إحصائية في نسب الإجابات التصحيحية على هذين السؤالين. في آن واحد التدابير المتكررة أنوفا سوف إجراء تحليل المتغيرات طريقة واحدة في اتجاه التباين إذا كان لديك متغير مستقل قاطع واحد ومتغير يعتمد عادة الفاصل الزمني الذي تم تكراره مرتين على الأقل لكل موضوع. هذا هو ما يعادل العينات المقترنة اختبار t، لكنه يسمح لمستويين أو أكثر من المتغير الفئوية. هذا الاختبار ما إذا كان متوسط المتغير التابع يختلف عن المتغير الفئوية. لدينا مجموعة بيانات نموذجية تدعى rb4. والذي يستخدم في كتاب كيركس التصميم التجريبي. في مجموعة البيانات هذه، y هو المتغير التابع، a هو المقياس المتكرر و s هو المتغير الذي يشير إلى رقم الموضوع. ستلاحظ أن هذا الإخراج يعطي أربع قيم p مختلفة. و كوتريغولاركوت (0.0001) هي قيمة p التي ستحصل عليها إذا افترضت التماثل المركب في مصفوفة التباين-التباين. ولأن هذا الافتراض غير صالح في كثير من الأحيان، فإن القيم P الأخرى الثلاثة تقدم تصويبات مختلفة (هيونه-فيلدت، H-F، غرينهوس-جيسر، G-G وصناديق المحافظ، مربع). بغض النظر عن قيمة p التي تستخدمها، تشير نتائجنا إلى أن لدينا تأثير ذو دلالة إحصائية عند مستوى 0.05. تكرار التدابير الانحدار اللوجستي إذا كان لديك نتيجة الثنائية تقاس مرارا وتكرارا لكل موضوع وكنت ترغب في تشغيل الانحدار اللوجستي الذي يمثل تأثير هذه التدابير متعددة من كل المواضيع، يمكنك تنفيذ تدابير المتكررة الانحدار اللوجستي. في ستاتا، يمكن القيام بذلك باستخدام الأمر شتجي والإشارة إلى الحدين كتوزيع الاحتمال و لوجيت كدالة الوصلة التي سيتم استخدامها في النموذج. ملف البيانات ممارسة يحتوي على 3 القياسات نبض من 30 شخصا تعيين ل 2 فوج نظام غذائي مختلفة و 3 أفواج ممارسة مختلفة. إذا عرفنا نبضة كوثيغكوت بأنها أكثر من 100، يمكننا بعد ذلك التنبؤ احتمال نبض عالية باستخدام فوج النظام الغذائي. أولا، نستخدم زستيست لتحديد المتغير الذي يعرف التكرار. في هذه المجموعة، هناك ثلاثة قياسات اتخذت لكل معرف. لذلك سوف نستخدم معرف كما متغير لوحة لدينا. ثم يمكننا استخدام ط: قبل النظام الغذائي حتى نتمكن من إنشاء متغيرات مؤشر حسب الحاجة. هذه النتائج تشير إلى أن النظام الغذائي ليست ذات دلالة إحصائية (Z 1.24، ص 0.216). أنوفا المعاملية إنوفا فاكتوري يحتوي على اثنين أو أكثر من المتغيرات المستقلة الفئوية (إما مع أو بدون التفاعلات) ومتغير واحد يعتمد عادة على الفاصل الزمني الموزع. على سبيل المثال، باستخدام ملف البيانات hsb2 سننظر في كتابة عشرات (الكتابة) كمتغير التابع والجنس (أنثى) والوضع الاجتماعي والاقتصادي (سيس) كمتغيرات مستقلة، وسوف تشمل تفاعل الإناث من قبل سيس. لاحظ أنه في ستاتا، لا يلزمك استخدام مصطلح (مصطلحات) التفاعل في مجموعة البيانات. بدلا من ذلك، يمكن أن يكون لديك ستاتا إنشاء إيثيم مؤقتا عن طريق وضع علامة النجمة بين المتغيرات التي سوف تشكل مصطلح التفاعل (ق). تشير هذه النتائج إلى أن النموذج الكلي ذو دلالة إحصائية (F 5.67، p 0.001). كما أن المتغيرات النسائية والإناث ذات دلالة إحصائية (F 16.59، p 0.0001 و F 6.61، p 0.0017، على التوالي). ومع ذلك، فإن هذا التفاعل بين الإناث و سيس ليست ذات دلالة إحصائية (F 0.13، p 0.8753). اختبار فريدمان يمكنك إجراء اختبار فريدمان عندما يكون لديك متغير مستقل واحد داخل المواد بمستويين أو أكثر ومتغير تابع ليس فاصلا وموزعا بشكل طبيعي (ولكن على الأقل ترتيبي). سنستخدم هذا الاختبار لتحديد ما إذا كان هناك فرق في درجات القراءة والكتابة والرياضيات. الفرضية الفارغة في هذا الاختبار هي أن توزيع صفوف كل نوع من درجات (أي القراءة والكتابة والرياضيات) هي نفسها. لإجراء اختبار فريدمان في ستاتا، تحتاج إلى أولا تحميل برنامج فريدمان الذي ينفذ هذا الاختبار. يمكنك تحميل فريدمان من داخل ستاتا عن طريق كتابة فينديت فريدمان (انظر كيف يمكنني استخدام الأمر فينديت للبحث عن البرامج والحصول على مساعدة إضافية لمزيد من المعلومات حول استخدام فينديت). أيضا، سوف تحتاج إلى نقل البيانات الخاصة بك بحيث الموضوعات هي الأعمدة والمتغيرات هي الصفوف. سنستخدم الأمر كبوس لترتيب بياناتنا بهذه الطريقة. مربع فريدمانز تشي قيمة 0.6175 وقيمة p من 0.7344 و ليست ذات دلالة إحصائية. وبالتالي، لا يوجد دليل على أن توزيعات الأنواع الثلاثة من الدرجات مختلفة. الانحدار اللوجستي المطلوب يستخدم الانحدار اللوجستي المطلوب عند طلب المتغير التابع ولكن ليس متواصلا. على سبيل المثال، باستخدام ملف البيانات hsb2 سنقوم بإنشاء متغير أمر يسمى write3. سيكون لهذا المتغير القيم 1 و 2 و 3، مما يشير إلى درجة كتابة منخفضة أو متوسطة أو عالية. نحن لا نوصي عموما بتصنيف متغير مستمر بهذه الطريقة نحن ببساطة إنشاء متغير لاستخدامه لهذا المثال. سوف نستخدم الجنس (الإناث)، وقراءة القراءة (قراءة) والدراسات الاجتماعية يسجل (سوست) كمتغيرات التنبؤ في هذا النموذج. تشير النتائج إلى أن النموذج الكلي ذو دلالة إحصائية (p ل .0000)، كما هو الحال بالنسبة لكل متغيرات التنبؤ (p لوت .000). هناك نوعان من نقاط القطع لهذا النموذج لأن هناك ثلاثة مستويات لمتغير النتيجة. واحدة من الافتراضات الكامنة وراء الانحدار اللوجستي الترتيبي (والترتيبية) هو أن العلاقة بين كل زوج من مجموعات النتائج هي نفسها. وبعبارة أخرى، يفترض الانحدار اللوجستي الترتيبي أن المعاملات التي تصف العلاقة بين الفئات الأقل مقابل جميع الفئات العليا لمتغير الاستجابة هي نفس المعاملات التي تصف العلاقة بين الفئة التالية التالية وكل الفئات الأعلى، وما إلى ذلك. وهذا ما يسمى افتراض الاحتمالات النسبية أو افتراض الانحدار المتوازي. لأن العلاقة بين جميع أزواج من المجموعات هي نفسها، وهناك مجموعة واحدة فقط من المعاملات (نموذج واحد فقط). إذا لم يكن هذا هو الحال، فإننا بحاجة إلى نماذج مختلفة (مثل نموذج لوجيت أمر المعمم) لوصف العلاقة بين كل زوج من مجموعات النتائج. لاختبار هذا الافتراض، يمكننا استخدام الأمر أوموديل (انظر فيوديت أومودل انظر كيف يمكنني استخدام الأمر فينديت للبحث عن البرامج والحصول على مساعدة إضافية لمزيد من المعلومات حول استخدام فينديت) أو الأمر برانت. وسوف تظهر كل من أدناه. ويشير كل من هذين الاختبارين إلى أن افتراض الاحتمالات النسبية لم ينتهك. الانحدار اللوجستي المعاملي يستخدم الانحدار اللوجستي المصاحب عندما يكون لديك متغيران مستقلان أو أكثر من المتغيرات المستقلة ولكن متغير ثنائي متفرع. على سبيل المثال، باستخدام ملف البيانات hsb2 سنستخدم الإناث كمتغير تابع لدينا، لأنه المتغير الثنائي (01) الوحيد في مجموعة البيانات لدينا ليس بالتأكيد لأنه ممارسة شائعة لاستخدام الجنس كمتغير النتيجة. سوف نستخدم نوع البرنامج (بروج) ونوع المدرسة (سكتيب) كمتغيرات متنبئ لدينا. لأن بروج هو متغير الفئوية (لديها ثلاثة مستويات)، ونحن بحاجة إلى إنشاء رموز وهمية لذلك. استخدام i. بروج يفعل ذلك. يمكنك استخدام الأمر لوجيت إذا كنت تريد أن ترى معاملات الانحدار أو الأمر اللوجستي إذا كنت تريد أن ترى نسب الأرجحية. تشير النتائج إلى أن النموذج الكلي ليس ذو دلالة إحصائية (لر chi2 3.15، p 0.6774). وعلاوة على ذلك، لا يوجد أي من المعاملات ذات دلالة إحصائية سواء. يمكننا استخدام الأمر اختبار للحصول على اختبار التأثير الكلي للبروج كما هو مبين أدناه. وهذا يدل على أن التأثير العام للبروج ليست ذات دلالة إحصائية. وبالمثل، يمكننا استخدام الأمر تستبارم للحصول على اختبار التأثير الكلي لل بروغ من خلال التفاعل ششتيب، كما هو مبين أدناه. وهذا يدل على أن التأثير الكلي لهذا التفاعل ليس ذو دلالة إحصائية. إذا كنت تفضل ذلك، يمكنك استخدام الأمر اللوجستي لعرض النتائج كنسب خلاف، كما هو موضح أدناه. الارتباط يكون الارتباط مفيدا عندما تريد أن ترى العلاقة الخطية بين متغيرين (أو أكثر) من الفواصل الزمنية الموزعة بشكل طبيعي. على سبيل المثال، باستخدام ملف البيانات hsb2 يمكننا تشغيل ارتباط بين متغيرين مستمرين، القراءة والكتابة. في المثال الثاني، سوف نقوم بتشغيل علاقة بين متغير ثنائي التفرع، الإناث. ومتغير مستمر، الكتابة. على الرغم من أنه من المفترض أن المتغيرات هي الفترة الفاصلة وتوزع عادة، يمكننا أن تشمل المتغيرات وهمية عند تنفيذ الارتباطات. في المثال الأول أعلاه، نرى أن الارتباط بين القراءة والكتابة هو 0.5968. من خلال تربيع الارتباط ثم ضرب من 100، يمكنك تحديد ما هي النسبة المئوية للتغير المشترك. يتيح الجولة 0.5968 لتكون 0.6، والتي عندما تربيع سيكون .36، مضروبا في 100 سيكون 36. وبالتالي قراءة أسهم حوالي 36 من تباينها مع الكتابة. في الإخراج للمثال الثاني، يمكننا أن نرى الارتباط بين الكتابة والإناث هو 0.2565. تربى هذا العدد غلة .06579225، وهذا يعني أن الإناث سهم تقريبا 6.5 من التباين مع الكتابة. الانحدار الخطي البسيط يتيح الانحدار الخطي البسيط لنا أن ننظر إلى العلاقة الخطية بين متنبأ فاصل موزعة بشكل طبيعي ومتغير ناتج واحد موزعة بشكل طبيعي. على سبيل المثال، باستخدام ملف البيانات hsb2. يقول نحن نود أن ننظر إلى العلاقة بين كتابة عشرات (الكتابة) وقراءة عشرات (قراءة) وبعبارة أخرى، والتنبؤ الكتابة من القراءة. ونرى أن العلاقة بين الكتابة والقراءة إيجابية (.5517051) واستنادا إلى القيمة t (10.47) و p-فالو (0.000)، فإننا نخلص إلى أن هذه العلاقة ذات دلالة إحصائية. وبالتالي، فإننا نقول أن هناك علاقة خطية إيجابية ذات دلالة إحصائية بين القراءة والكتابة. الارتباط غير البارامتري يستخدم ارتباط سبيرمان عندما لا يفترض أن يكون أحد المتغيرين أو كلاهما موزعا بشكل طبيعي والفاصل الزمني (ولكن يفترض أن يكون ترتيبا). يتم تحويل قيم المتغيرات في الرتب ثم يتم ربطها. في مثالنا، سوف نبحث عن علاقة بين القراءة والكتابة. ونحن لن نفترض أن كلا من هذه المتغيرات طبيعية وفترة. تشير النتائج إلى أن العلاقة بين القراءة والكتابة (رو 0.6167، p 0.000) ذات دلالة إحصائية. انحدار لوجستي بسيط يفترض الانحدار اللوجستي أن متغير النتيجة ثنائي (أي مشفر مثل 0 و 1). لدينا متغير واحد فقط في ملف البيانات hsb2 الذي تم ترميزه 0 و 1، وهذا هو الإناث. ونحن نفهم أن الإناث هو متغير نتائج سخيفة (سيكون من المنطقي استخدامه كمتغير متنبئ)، ولكن يمكننا استخدام الإناث كمتغير النتيجة لتوضيح كيفية تنظيم التعليمات البرمجية لهذا الأمر وكيفية تفسير الناتج. المتغير الأول المدرج بعد أمر لوجيستيك (أو لوجيت) هو المتغير (أو المعتمد) الناتج، وجميع المتغيرات المتبقية متغيرات (أو مستقلة). يمكنك استخدام الأمر لوجيت إذا كنت تريد أن ترى معاملات الانحدار أو الأمر اللوجستي إذا كنت تريد أن ترى نسب الأرجحية. في مثالنا، سوف تكون الإناث المتغير النتيجة، وقراءة سيكون متغير التنبؤ. كما هو الحال مع انحدار عملية شريان الحياة للسودان، يجب أن تكون متغيرات التنبؤ إما ثنائية التفرع أو مستمرة لا يمكن أن تكون فئوية. وتشير النتائج إلى أن درجة القراءة (قراءة) ليست مؤشرا هاما إحصائيا للجنس (أي كونها أنثى)، z -0.75، p 0.453. وبالمثل، فإن اختبار النموذج العام ليست ذات دلالة إحصائية، لر تشي مربع 0،56، ص 0.4527. الانحدار المتعدد الانحدار المتعدد هو مماثل جدا للانحدار البسيط، إلا أنه في الانحدار المتعدد لديك أكثر من متغير متنبأ واحد في المعادلة. على سبيل المثال، باستخدام ملف البيانات hsb2 سوف نتوقع درجة الكتابة من الجنسين (الإناث)، والقراءة والرياضيات والعلوم والدراسات الاجتماعية (سوست) عشرات. تشير النتائج إلى أن النموذج الكلي ذو دلالة إحصائية (F 58.60، p 0.0000). وعلاوة على ذلك، فإن جميع متغيرات التنبؤ ذات دلالة إحصائية باستثناء القراءة. تحليل التباين المشترك تحليل التباين هو مثل أنوفا، باستثناء بالإضافة إلى التنبؤات الفئوية لديك أيضا تنبؤات مستمرة كذلك. على سبيل المثال، مثال أنوفا طريقة واحدة تستخدم الكتابة كمتغير تابع و بروج كمتغير مستقل. يتيح إضافة قراءة كمتغير مستمر لهذا النموذج، كما هو مبين أدناه. تشير النتائج إلى أنه حتى بعد ضبط درجة القراءة (قراءة)، لا تزال درجات الكتابة تختلف اختلافا كبيرا حسب نوع البرنامج (بروج) F 5.87، p 0.0034. الانحدار اللوجستي المتعدد هو مثل الانحدار اللوجستي بسيط، إلا أن هناك اثنين أو أكثر من التنبؤات. ويمكن أن تكون المتنبئات متغيرات فاصلة أو متغيرات وهمية، ولكن لا يمكن أن تكون متغيرات فئوية. إذا كان لديك تنبؤات قاطعة، يجب أن يتم ترميزها في واحد أو أكثر من المتغيرات وهمية. لدينا متغير واحد فقط في مجموعة البيانات لدينا التي تم ترميز 0 و 1، وهذا هو الإناث. ونحن نفهم أن الإناث هو متغير نتائج سخيفة (سيكون من المنطقي استخدامه كمتغير متنبئ)، ولكن يمكننا استخدام الإناث كمتغير النتيجة لتوضيح كيفية تنظيم التعليمات البرمجية لهذا الأمر وكيفية تفسير الناتج. المتغير الأول المدرج بعد أمر لوجيستيك (أو لوجيت) هو المتغير (أو المعتمد) الناتج، وجميع المتغيرات المتبقية متغيرات (أو مستقلة). يمكنك استخدام الأمر لوجيت إذا كنت تريد أن ترى معاملات الانحدار أو الأمر اللوجستي إذا كنت تريد أن ترى نسب الأرجحية. في مثالنا، سوف تكون الإناث متغير النتيجة، والقراءة والكتابة ستكون متغيرات التنبؤ. وتظهر هذه النتائج أن كلا من القراءة والكتابة هي منبئات هامة للإناث. التحليل التمييزي يستخدم التحليل التمييزي عندما يكون لديك متغير مستقل واحد أو أكثر موزعة بشكل طبيعي ومتغير تابع تصنيفي. وهي تقنية متعددة المتغيرات التي تأخذ في الاعتبار الأبعاد الكامنة في المتغيرات المستقلة للتنبؤ بعضوية المجموعة في المتغير التابع الفئوي. على سبيل المثال، باستخدام ملف البيانات hsb2. ويقول نحن نود أن استخدام القراءة. والكتابة والرياضيات عشرات للتنبؤ نوع البرنامج ينتمي الطالب ل (بروج). لهذا التحليل، تحتاج أولا إلى تنزيل برنامج داونواي الذي يؤدي هذا الاختبار. يمكنك تحميل داونيواي من داخل ستاتا عن طريق كتابة فينديت دونيواي (انظر كيف يمكنني استخدام الأمر فينديت للبحث عن البرامج والحصول على مساعدة إضافية لمزيد من المعلومات حول استخدام فينديت). يمكنك بعد ذلك إجراء تحليل وظيفة التمييز مثل هذا. ومن الواضح أن الناتج ستاتا لهذا الإجراء طويل، وأنه خارج نطاق هذه الصفحة لشرح كل ذلك. ومع ذلك، فإن النقطة الرئيسية هي أن اثنين من المتغيرات الكنسي يتم تحديدها من قبل التحليل، وأولها يبدو أن أكثر ارتباطا نوع البرنامج من الثانية. لمزيد من المعلومات، انظر هذه الصفحة على تحليل وظيفة التمييز. في اتجاه واحد مانوفا مانوفا (تحليل متعدد المتغيرات من التباين) مثل أنوفا، إلا أن هناك اثنين أو أكثر من المتغيرات التابعة. في اتجاه واحد مانوفا، هناك متغير مستقل واحد قاطع واثنين أو أكثر من المتغيرات التابعة. على سبيل المثال، باستخدام ملف البيانات hsb2. نقول إننا نرغب في دراسة الاختلافات في القراءة. والكتابة والرياضيات موزعة حسب نوع البرنامج (بروج). لهذا التحليل، يمكنك استخدام الأمر مانوفا ومن ثم إجراء تحليل مثل هذا. وينتج هذا الأمر ثلاث إحصاءات اختبار مختلفة تستخدم لتقييم الدلالة الإحصائية للعلاقة بين المتغير المستقل ومتغيرات النتائج. ووفقا للمعايير الثلاثة، يختلف الطلاب في البرامج المختلفة في توزيعهم المشترك للقراءة. والكتابة والرياضيات. Multivariate multiple regression Multivariate multiple regression is used when you have two or more dependent variables that are to be predicted from two or more predictor variables. In our example, we will predict write and read from female . math . science and social studies ( socst ) scores. Many researchers familiar with traditional multivariate analysis may not recognize the tests above. They do not see Wilks Lambda, Pillais Trace or the Hotelling-Lawley Trace statistics, the statistics with which they are familiar. It is possible to obtain these statistics using the mvtest command written by David E. Moore of the University of Cincinnati. UCLA updated this command to work with Stata 6 and above. You can download mvtest from within Stata by typing findit mvtest (see How can I used the findit command to search for programs and get additional help for more information about using findit ). Now that we have downloaded it, we can use the command shown below. These results show that female has a significant relationship with the joint distribution of write and read . The mvtest command could then be repeated for each of the other predictor variables. Canonical correlation Canonical correlation is a multivariate technique used to examine the relationship between two groups of variables. For each set of variables, it creates latent variables and looks at the relationships among the latent variables. It assumes that all variables in the model are interval and normally distributed. Stata requires that each of the two groups of variables be enclosed in parentheses. There need not be an equal number of variables in the two groups. The output above shows the linear combinations corresponding to the first canonical correlation. At the bottom of the output are the two canonical correlations. These results indicate that the first canonical correlation is .7728. You will note that Stata is brief and may not provide you with all of the information that you may want. Several programs have been developed to provide more information regarding the analysis. You can download this family of programs by typing findit cancor (see How can I used the findit command to search for programs and get additional help for more information about using findit ). Because the output from the cancor command is lengthy, we will use the cantest command to obtain the eigenvalues, F-tests and associated p-values that we want. Note that you do not have to specify a model with either the cancor or the cantest commands if they are issued after the canon command. The F-test in this output tests the hypothesis that the first canonical correlation is equal to zero. Clearly, F 56.4706 is statistically significant. However, the second canonical correlation of .0235 is not statistically significantly different from zero (F 0.1087, p 0.7420). Factor analysis Factor analysis is a form of exploratory multivariate analysis that is used to either reduce the number of variables in a model or to detect relationships among variables. All variables involved in the factor analysis need to be continuous and are assumed to be normally distributed. The goal of the analysis is to try to identify factors which underlie the variables. There may be fewer factors than variables, but there may not be more factors than variables. For our example, lets suppose that we think that there are some common factors underlying the various test scores. We will first use the principal components method of extraction (by using the pc option) and then the principal components factor method of extraction (by using the pcf option). This parallels the output produced by SAS and SPSS. Now lets rerun the factor analysis with a principal component factors extraction method and retain factors with eigenvalues of .5 or greater. Then we will use a varimax rotation on the solution. Note that by default, Stata will retain all factors with positive eigenvalues hence the use of the mineigen option or the factors() option. The factors() option does not specify the number of solutions to retain, but rather the largest number of solutions to retain. From the table of factor loadings, we can see that all five of the test scores load onto the first factor, while all five tend to load not so heavily on the second factor. Uniqueness (which is the opposite of commonality) is the proportion of variance of the variable (i. e. read ) that is not accounted for by all of the factors taken together, and a very high uniqueness can indicate that a variable may not belong with any of the factors. Factor loadings are often rotated in an attempt to make them more interpretable. Stata performs both varimax and promax rotations. The purpose of rotating the factors is to get the variables to load either very high or very low on each factor. In this example, because all of the variables loaded onto factor 1 and not on factor 2, the rotation did not aid in the interpretation. Instead, it made the results even more difficult to interpret. To obtain a scree plot of the eigenvalues, you can use the greigen command. We have included a reference line on the y-axis at one to aid in determining how many factors should be retained.
No comments:
Post a Comment