معلومة

كيف يمكنني فصل وفرة نتائج الحدوث؟

كيف يمكنني فصل وفرة نتائج الحدوث؟


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

يجب أن أحسب قيم الإصابة بفيروس موزاييك البطيخ في المواسم المختلفة ضمن عامل الموطن.

تأتي بيانات الحدوث هذه من اكتشاف العدوى لبعض النباتات المأخوذة في موائل مختلفة (Oakwoods ، Wastelands ، Edges ، Crops). تم أخذ عينات من النباتات في هذه الموائل في مواسم مختلفة (الصيف ، الربيع ، الخريف) تم أخذ عينات من موطن المحاصيل فقط في الصيف ، وكان العائل الذي تم أخذ عينات منه في المحاصيل في غالبية أنواع Cucumis melo.

هذا الفيروس مفضل ضد موطن المحاصيل ، مضيف كوكوميس ميلو. حسبت الحدوث ، ثم حسبت الفرق الكبير بينهما. أظهر اختبار فيشر أن الإصابة أعلى في الصيف وفي مضيف كوكوميس ميلو.

هل من الممكن فصل تأثيرات وفرة المحاصيل والكوكوميس (أخذ العينات غير المتوازن للمواسم عبر الموائل) لاستنتاجي للتباين الموسمي الكبير؟

أعلم أن استنتاجاتي ليست في الحقيقة تأثيرًا موسميًا. لأنني أخذت عينات من 10000 نبتة شمام لفترة قصيرة في الصيف ، وهذا هو المضيف المفضل.

كيف يمكنني فصل وفرة نتائج الحدوث؟ ما هو التحليل الإحصائي الذي يمكنني إجراؤه؟

شكرا لك مقدما


تلاميذ ر& ndashtest لعينتين

استخدم الطالب ر& ndashtest لعينتين عندما يكون لديك متغير قياس واحد ومتغير اسمي واحد ، ويكون للمتغير الاسمي قيمتان فقط. يختبر ما إذا كانت وسائل متغير القياس مختلفة في المجموعتين.

مقدمة

هناك العديد من الاختبارات الإحصائية التي تستخدم توزيع t ويمكن تسميتها a ر& ndashtest. واحدة من أكثرها شيوعًا هي Student's ر& ndashtest لعينتين. آخر ر& ndashtests تشمل العينة الواحدة ر& ndashtest ، الذي يقارن متوسط ​​عينة بمتوسط ​​نظري ، والمتوسط ​​المزدوج ر& ndashtest.

تلاميذ ر& ndashtest لعينتين متطابق رياضياً مع anova أحادي الاتجاه بفئتين لأن مقارنة وسائل عينتين هو تصميم تجريبي شائع ، ولأن ر& ndashtest مألوف لدى العديد من الأشخاص أكثر من anova ، فأنا أعالج العينة المكونة من عينتين ر& ndashtest بشكل منفصل.

متى يتم استخدامه

استخدم النموذجين ر& ndashtest عندما يكون لديك متغير اسمي واحد ومتغير قياس واحد ، وتريد مقارنة القيم المتوسطة لمتغير القياس. يجب أن يحتوي المتغير الاسمي على قيمتين فقط ، مثل "ذكر" و "أنثى" أو "معالج" و "غير معالج".

فرضية العدم

الفرضية الصفرية الإحصائية هي أن وسائل متغير القياس متساوية للفئتين.

كيف يعمل الاختبار

إحصاء الاختبار ، tس، يتم حسابها باستخدام صيغة بها فرق بين متوسطات البسط ، وهذا يجعل tس تصبح أكبر كلما تباعدت الوسائل. المقام هو الخطأ المعياري للاختلاف في الوسيلة ، والذي يصبح أصغر مع تناقص تباينات العينة أو زيادة أحجام العينة. وهكذا رس يزداد حجمها مع تباعد الوسائل ، أو تصغير التباينات ، أو زيادة أحجام العينة.

تقوم بحساب احتمال الحصول على t المرصودس القيمة تحت فرضية العدم باستخدام توزيع t. شكل توزيع t ، وبالتالي احتمال الحصول على t معينس القيمة ، تعتمد على عدد درجات الحرية. درجات الحرية ل ر& ndashtest هو إجمالي عدد المشاهدات في المجموعات ناقص 2 أو n1+ ن2& ناقص 2.

الافتراضات

ال ر& ndashtest يفترض أن الملاحظات داخل كل مجموعة يتم توزيعها بشكل طبيعي. لحسن الحظ ، ليس حساسًا على الإطلاق للانحرافات عن هذا الافتراض ، إذا كانت توزيعات المجموعتين متطابقة (إذا كان كلا التوزيعين منحرفين إلى اليمين ، على سبيل المثال). لقد أجريت عمليات محاكاة باستخدام مجموعة متنوعة من التوزيعات غير العادية ، بما في ذلك التوزيعات المسطحة والثنائية والمنحرفة بدرجة عالية ، والعينتين ر& ndashtest يعطي دائمًا حوالي 5٪ إيجابيات خاطئة ، حتى مع أحجام عينات صغيرة جدًا. إذا كانت بياناتك غير طبيعية بشكل كبير ، فلا يزال يتعين عليك محاولة العثور على تحويل للبيانات يجعلها أكثر طبيعية ، ولكن لا تقلق إذا لم تتمكن من العثور على تحول جيد أو لم يكن لديك بيانات كافية للتحقق من الحالة الطبيعية.

إذا كانت بياناتك غير طبيعية بشدة ، و لديك توزيعات مختلفة في المجموعتين (مجموعة بيانات تميل إلى اليمين والأخرى منحرفة إلى اليسار ، على سبيل المثال) ، و لديك عينات صغيرة (أقل من 50 أو نحو ذلك) ، ثم العينة الثانية ر& ndashtest يمكن أن يعطي نتائج غير دقيقة ، مع أكثر من 5٪ إيجابيات كاذبة. لن يساعدك تحويل البيانات هنا ولا اختبار Mann-Whitney U. سيكون من غير المعتاد في علم الأحياء أن يكون لديك مجموعتان بتوزيعات مختلفة ولكن بوسائل متساوية ، ولكن إذا كنت تعتقد أن هذا احتمال ، فيجب أن تحتاج إلى ص قيمة أقل بكثير من 0.05 لرفض فرضية العدم.

العينة المزدوجة ر& ndashtest يفترض أيضًا المثلية الجنسية (تباينات متساوية في المجموعتين). إذا كان لديك تصميم متوازن (أحجام عينات متساوية في المجموعتين) ، فإن الاختبار ليس حساسًا جدًا للتغاير المرونة ما لم يكن حجم العينة صغيرًا جدًا (أقل من 10 أو نحو ذلك) ، يمكن أن تكون الانحرافات المعيارية في مجموعة واحدة أكبر بعدة مرات كما في المجموعة الأخرى ، وستحصل على ص& lt0.05 حوالي 5٪ من الوقت إذا كانت الفرضية الصفرية صحيحة. مع التصميم غير المتوازن ، تعد عدم التجانس مشكلة أكبر إذا كانت المجموعة ذات حجم العينة الأصغر لديها انحراف معياري أكبر ، العينة المكونة من عينتين ر& ndashtest يمكن أن يعطيك الكثير من الإيجابيات الكاذبة. إذا كان لدى مجموعتك انحرافات معيارية مختلفة اختلافًا جوهريًا (مثل انحراف معياري واحد أكبر بمرتين من الآخر) ، وكانت أحجام عينتك صغيرة (أقل من 10) أو غير متساوية ، فيجب عليك استخدام ويلش ر& ndashtest بدلاً من ذلك.

مثال

في خريف 2004 ، الطلاب في الساعة 2 بعد الظهر. كان متوسط ​​الارتفاع في قسم صفي لتحليل البيانات البيولوجية 66.6 بوصة ، بينما كان متوسط ​​الارتفاع في الساعة 5 مساءً. كان المقطع 64.6 بوصة. هل متوسط ​​ارتفاعات القسمين مختلف بشكل كبير؟ ها هي البيانات:

2 بعد الظهر5 مساءً
6968
7062
6667
6368
6869
7067
6961
6759
6262
6361
7669
5966
6262
6262
7561
6270
72
63

يوجد متغير قياس واحد ، الارتفاع ، ومتغير اسمي واحد ، قسم فئة. الفرضية الصفرية هي أن متوسط ​​الارتفاعات في القسمين هو نفسه. نتائج ر& ndashtest (t = 1.29، 32 d.f.، ص= 0.21) لا ترفض فرضية العدم.

رسم النتائج بيانيًا

نظرًا لأنها تقارن رقمين فقط ، فنادراً ما ستضع نتائج a ر& ndashtest في رسم بياني للنشر. بالنسبة للعرض التقديمي ، يمكنك رسم رسم بياني شريطي مثل الرسم البياني للتباين أحادي الاتجاه.

اختبارات مماثلة

تلاميذ ر& ndashtest متطابق رياضيًا مع anova أحادي الاتجاه الذي تم إجراؤه على البيانات مع فئتين ستحصل عليهما بالضبط ص قيمة من عينتين ر& ndashtest ومن anova أحادي الاتجاه ، على الرغم من حساب إحصائيات الاختبار بشكل مختلف. ال ر& ndashtest أسهل في القيام به وهو مألوف لدى المزيد من الأشخاص ، ولكنه يقتصر على فئتين فقط من البيانات. يمكنك عمل تحليل تحليل أحادي الاتجاه على فئتين أو أكثر. أوصي بأنه إذا كان بحثك يتضمن دائمًا مقارنة وسيلتين فقط ، فيجب عليك تسمية اختبارك بعينتين ر& ndashtest ، لأنه مألوف أكثر لدى المزيد من الأشخاص. إذا كتبت ورقة تتضمن بعض المقارنات بين وسيلتين وبعض المقارنات لأكثر من وسيلتين ، فقد ترغب في استدعاء جميع الاختبارات أحادية الاتجاه ، بدلاً من التبديل بين اسمين مختلفين (ر& ndashtest و anova أحادي الاتجاه) لنفس الشيء.

اختبار Mann-Whitney U هو بديل غير حدودي للعينتين ر& ndashtest الذي يوصي به بعض الأشخاص للبيانات غير العادية. ومع ذلك ، إذا كان للعينتين نفس التوزيع ، فإن العينة المكونة من عينتين ر& ndashtest ليس حساسًا للانحرافات عن الحياة الطبيعية ، لذا يمكنك استخدام الأكثر قوة والأكثر دراية ر& ndashtest بدلاً من اختبار Mann-Whitney U-test. إذا كان للعينتين توزيعات مختلفة ، فإن اختبار Mann-Whitney U ليس أفضل من ر& ndashtest. لذلك لا يوجد سبب حقيقي لاستخدام اختبار Mann-Whitney U-test ما لم يكن لديك متغير مصنف حقيقي بدلاً من متغير قياس.

إذا كانت الفروق بعيدة عن أن تكون متساوية (أحد الانحراف المعياري أكبر بمرتين أو أكثر من الآخر) وكانت أحجام العينة الخاصة بك إما صغيرة (أقل من 10) أو غير متساوية ، فيجب عليك استخدام Welch ر& ndashtest (المعروف أيضًا باسم Aspin-Welch أو Welch-Satterthwaite أو Aspin-Welch-Satterthwaite أو Satterthwaite ر& ndashtest). إنه مشابه للطالب ر& ndashtest إلا أنه لا يفترض أن الانحرافات المعيارية متساوية. إنها أقل قوة بقليل من قوة الطالب ر& ndashtest عندما تكون الانحرافات المعيارية متساوية ، ولكن يمكن أن تكون أكثر دقة عندما تكون الانحرافات المعيارية غير متساوية للغاية. عينتي ر& ndashtest جدول البيانات سيحسب قيمة ولش ر& ndashtest. يمكنك أيضا أن تفعل ويلش ر& ndashtest باستخدام صفحة الويب هذه ، بالنقر فوق الزر المسمى "Welch's unpaired ر& ndashtest ".

استخدم الأزواج ر& ndashtest عندما تأتي ملاحظات القياس في أزواج ، مثل مقارنة نقاط قوة الذراع الأيمن مع قوة الذراع اليسرى في مجموعة من الأشخاص.

استخدم العينة الواحدة ر& ndashtest عندما يكون لديك مجموعة واحدة فقط ، وليس مجموعتين ، وتقارن متوسط ​​متغير القياس لتلك المجموعة بتوقع نظري.

كيف تفعل الاختبار

جداول البيانات

لقد قمت بإعداد جدول بيانات لعينتين ر& ndashtests. سوف يؤدي أي من الطالب ر& ndashtest أو ويلش ر& ndashtest حتى 2000 ملاحظة في كل مجموعة.

صفحات الانترنت

هناك صفحات ويب للقيام بـ ر& ndashtest هنا وهنا. كلاهما سيفعل كلا من الطالب ر& ndashtest و ويلش ر& ndashtest.

يمكنك استخدام PROC TTEST للطالب ر& ndashtest المعلمة CLASS هي المتغير الاسمي ، ومعلمة VAR هي متغير القياس. فيما يلي مثال على برنامج لبيانات الارتفاع أعلاه.

يتضمن الإخراج الكثير من المعلومات ص قيمة للطالب ر& ndashtest موجود ضمن "Pr & gt | t | في السطر المسمى" مجمّع "، و ص قيمة لويلش ر& ndashtest على السطر المسمى "Satterthwaite." لهذه البيانات ، فإن ص القيمة هي 0.2067 للطالب ر& ndashtest و 0.1995 لـ Welch's.

تحليل القوة

لتقدير أحجام العينات اللازمة لاكتشاف فرق كبير بين وسيلتين ، تحتاج إلى ما يلي:

  • حجم التأثير ، أو الاختلاف في يعني أنك تأمل في اكتشافه
  • الانحراف المعياري. عادةً ما تستخدم نفس القيمة لكل مجموعة ، ولكن إذا كنت تعلم مسبقًا أن إحدى المجموعات سيكون لها انحراف معياري أكبر من الأخرى ، فيمكنك استخدام أرقام مختلفة
  • ألفا ، أو مستوى الأهمية (عادة 0.05)
  • بيتا ، احتمال قبول فرضية العدم عندما تكون خاطئة (0.50 و 0.80 و 0.90 هي قيم شائعة)
  • نسبة حجم العينة إلى الآخر. أقوى تصميم هو الحصول على أعداد متساوية في كل مجموعة (N12= 1.0) ، ولكن في بعض الأحيان يكون من الأسهل الحصول على أعداد كبيرة من إحدى المجموعات. على سبيل المثال ، إذا كنت تقارن قوة العظام في الفئران التي تمت تربيتها في حالة انعدام الجاذبية على متن محطة الفضاء الدولية مقابل الفئران الضابطة التي تمت تربيتها على الأرض ، فقد تقرر مسبقًا استخدام ثلاثة فئران تحكم لكل فأر فضاء باهظ الثمن (ن12=3.0)

سيحسب برنامج G * Power حجم العينة المطلوب لعينة من عينتين ر& ndashtest. اختر "اختبارات t" من قائمة "عائلة الاختبار" و "الوسائل: الفرق بين وسيلتين مستقلتين (مجموعتين" من قائمة "الاختبار الإحصائي". انقر فوق الزر "تحديد" وأدخل الوسائل والانحرافات المعيارية التي تتوقعها كل مجموعة. فقط الفرق بين المجموعة يعني أنه مهم هو حجم التأثير الخاص بك. انقر فوق "حساب ونقل إلى النافذة الرئيسية". قم بتغيير "ذيول" إلى اثنين ، واضبط ألفا (سيكون هذا دائمًا 0.05) وقوتك (0.5 أو 0.8 أو 0.9 شائعة الاستخدام). إذا كنت تخطط للحصول على ملاحظات في مجموعة أكثر من الأخرى ، فيمكنك جعل "نسبة التخصيص" مختلفة عن 1.

كمثال ، لنفترض أنك تريد معرفة ما إذا كان الأشخاص الذين يجرون بانتظام لديهم أقدام أوسع من الأشخاص الذين لا يجرون. يمكنك البحث عن البيانات المنشورة مسبقًا حول عرض القدم والعثور على مجموعة بيانات ANSUR ، والتي تُظهر متوسط ​​عرض القدم للرجال الأمريكيين يبلغ 100.6 ملم وانحراف معياري يبلغ 5.26 ملم. قررت أنك تريد أن تكون قادرًا على اكتشاف فرق يبلغ 3 مم في متوسط ​​عرض القدم بين العدائين وغير العدائين. باستخدام G * Power ، تقوم بإدخال 100 مم لمتوسط ​​المجموعة 1 ، و 103 لمتوسط ​​المجموعة 2 ، و 5.26 للانحراف المعياري لكل مجموعة. قررت أنك تريد اكتشاف فرق قدره 3 مم ، على مستوى P & lt0.05 ، مع احتمال اكتشاف فرق بهذا الحجم ، إن وجد ، بنسبة 90٪ (1 & minusbeta = 0.90). إدخال كل هذه الأرقام في G * Power يعطي حجم عينة لكل مجموعة مكونة من 66 شخصًا.

& lArr الموضوع السابق | الموضوع التالي & rArr جدول المحتويات

تم إجراء آخر مراجعة لهذه الصفحة في 20 يوليو 2015. عنوانها هو http://www.biostathandbook.com/twosamplettest.html. يمكن أن يقتبس على النحو التالي:
ماكدونالد ، ج. 2014. كتيب الإحصاءات البيولوجية (الطبعة الثالثة). دار سباركي للنشر ، بالتيمور ، ماريلاند. تحتوي صفحة الويب هذه على محتوى الصفحات 126-130 في النسخة المطبوعة.

& copy2014 بواسطة John H. McDonald. ربما يمكنك فعل ما تريد باستخدام هذا المحتوى ، راجع صفحة الأذونات للحصول على التفاصيل.


تحويلات البيانات

إذا كان متغير القياس لا يتناسب مع التوزيع الطبيعي أو لديه انحرافات معيارية مختلفة بشكل كبير في مجموعات مختلفة ، يجب أن تجرب تحويل البيانات.

مقدمة

لا تفي العديد من المتغيرات البيولوجية بافتراضات الاختبارات الإحصائية البارامترية: فهي غير موزعة بشكل طبيعي ، أو أن الانحرافات المعيارية ليست متجانسة ، أو كلاهما. قد يؤدي استخدام اختبار إحصائي حدودي (مثل التحليل الانحداري أو الانحدار الخطي) على هذه البيانات إلى نتيجة مضللة. في بعض الحالات ، سيؤدي تحويل البيانات إلى جعلها تناسب الافتراضات بشكل أفضل.

رسوم بيانية لعدد من طين الطيني الشرقي لكل 75 مترًا من الدفق (تم استبعاد العينات التي تحتوي على 0 قروش طينية). بيانات غير محولة على اليسار ، بيانات محولة بسجل على اليمين. رسوم بيانية لعدد من طين الطين الشرقي لكل قسم 75 مترًا من الدفق (تم استبعاد العينات التي تحتوي على 0 طين طيني). بيانات غير محولة على اليسار ، بيانات محولة بسجل على اليمين.

لتحويل البيانات ، تقوم بإجراء عملية حسابية على كل ملاحظة ، ثم تستخدم هذه الأرقام المحولة في الاختبار الإحصائي الخاص بك. على سبيل المثال ، كما هو موضح في الرسم البياني الأول أعلاه ، وفرة أنواع الأسماك أومبرا بيجمايا (الطينية الشرقية) في تيارات ماريلاند غير موزعة بشكل طبيعي ، فهناك الكثير من الجداول ذات الكثافة الصغيرة من الطين ، وعدد قليل من الجداول مع الكثير منها. يؤدي تطبيق تحويل السجل إلى جعل البيانات أكثر طبيعية ، كما هو موضح في الرسم البياني الثاني.

مودمينو الشرقية (قزم أومبرا).

فيما يلي 12 رقمًا من مجموعة بيانات mudminnow ، العمود الأول هو البيانات غير المحولة ، والعمود الثاني هو الجذر التربيعي للرقم في العمود الأول ، والعمود الثالث هو اللوغاريتم الأساسي 10 للرقم في العمود الأول.

أنت تفعل الإحصائيات على الأرقام المحولة. على سبيل المثال ، متوسط ​​البيانات غير المحولة هو 18.9 ، ومتوسط ​​البيانات المحولة ذات الجذر التربيعي هو 3.89 ، ومتوسط ​​البيانات المحولة للسجل هو 1.044. إذا كنت تقارن وفرة الأسماك في مستجمعات المياه المختلفة ، وقررت أن تحويل اللوغاريتمات هو الأفضل ، فستقوم بعمل anova أحادي الاتجاه على سجلات وفرة الأسماك ، وستختبر الفرضية الصفرية بأن وسائل السجل- كانت وفرة المحولة متساوية.

عودة التحول

على الرغم من أنك أجريت اختبارًا إحصائيًا على متغير تم تحويله ، مثل سجل وفرة الأسماك ، فليس من الجيد الإبلاغ عن الوسائل والأخطاء المعيارية وما إلى ذلك في الوحدات المحولة. الرسم البياني الذي أظهر أن متوسط ​​سجل الأسماك لكل 75 مترًا من المجرى كان 1.044 لن يكون مفيدًا جدًا لشخص لا يستطيع عمل الأسس الكسرية في رؤوسهم. بدلاً من ذلك ، يجب عليك إعادة تحويل نتائجك. يتضمن ذلك القيام بعكس الوظيفة الرياضية التي استخدمتها في تحويل البيانات. بالنسبة لتحويل السجل ، يمكنك إجراء تحويل عكسي عن طريق رفع 10 إلى قوة رقمك. على سبيل المثال ، بيانات السجل المحولة أعلاه لها متوسط ​​1.044 وفاصل ثقة 95٪ من & plusmn0.344 سمكة محولة لوغاريتمية. سيكون المتوسط ​​المحول للخلف 10 1.044 = 11.1 سمكة. سيكون حد الثقة الأعلى 10 (1.044 + 0.344) = 24.4 سمكة ، والحد الأدنى للثقة سيكون 10 (1.044-0.344) = 5.0 سمكة. لاحظ أن فاصل الثقة ليس متماثلًا ، فالحد الأعلى هو 13.3 سمكة فوق المتوسط ​​، بينما الحد الأدنى هو 6.1 سمكة أقل من المتوسط. لاحظ أيضًا أنه لا يمكنك إعادة تحويل فاصل الثقة فقط وإضافة أو طرح ذلك من التحويل الخلفي يعني أنه لا يمكنك أخذ 10 0.344 وإضافة ذلك أو طرحه.

اختيار التحول الصحيح

تعد تحويلات البيانات أداة مهمة للتحليل الإحصائي المناسب للبيانات البيولوجية. ومع ذلك ، بالنسبة لأولئك الذين لديهم معرفة محدودة بالإحصاءات ، قد يبدو الأمر مريبًا بعض الشيء ، وهو شكل من أشكال التلاعب ببياناتك من أجل الحصول على الإجابة التي تريدها. لذلك من الضروري أن تكون قادرًا على الدفاع عن استخدامك لتحويلات البيانات.

يوجد عدد لا حصر له من التحويلات التي يمكنك استخدامها ، ولكن من الأفضل استخدام التحويل الذي يستخدمه الباحثون الآخرون بشكل شائع في مجالك ، مثل تحويل الجذر التربيعي لبيانات العد أو تحويل السجل لبيانات الحجم. حتى لو كان التحول الغامض الذي لم يسمع به الكثير من الناس يعطيك بيانات أكثر طبيعية أو أكثر عن المثلية ، فمن الأفضل استخدام تحول أكثر شيوعًا حتى لا يشك الناس. تذكر أن بياناتك لا يجب أن تكون طبيعية تمامًا وأن الاختبارات البارامترية المثلية ليست حساسة للغاية للانحرافات عن افتراضاتها.

من المهم أيضًا أن تقرر التحويل الذي تريد استخدامه قبل إجراء الاختبار الإحصائي. محاولة إجراء تحولات مختلفة حتى تجد التحويل الذي يمنحك نتيجة مهمة هو الغش. إذا كان لديك عدد كبير من الملاحظات ، فقارن بين تأثيرات التحولات المختلفة على الحالة الطبيعية والمثلية الجنسية للمتغير. إذا كان لديك عدد قليل من الملاحظات ، فقد لا تتمكن من رؤية تأثير كبير للتحولات على الحالة الطبيعية والمثلية الجنسية في هذه الحالة ، يجب عليك استخدام أي تحول يستخدمه الأشخاص في مجالك بشكل روتيني لمتغيرك.على سبيل المثال ، إذا كنت تدرس مسافة تشتت حبوب اللقاح ويقوم الأشخاص الآخرون بتسجيلها بشكل روتيني ، فيجب عليك أيضًا تسجيل تحويل مسافة حبوب اللقاح ، حتى لو كان لديك 10 ملاحظات فقط وبالتالي لا يمكنك حقًا النظر إلى الحالة الطبيعية باستخدام الرسم البياني.

التحولات المشتركة

هناك العديد من التحولات التي تُستخدم أحيانًا في علم الأحياء ، وهنا ثلاثة من أكثرها شيوعًا:

سجل التحول. هذا يتكون من أخذ سجل كل ملاحظة. يمكنك استخدام السجلات العشرة الأساسية (LOG في جدول بيانات ، LOG10 في SAS) أو القاعدة-ه السجلات ، والمعروفة أيضًا باسم السجلات الطبيعية (LN في جدول بيانات ، LOG في SAS). لا يوجد فرق في الاختبار الإحصائي سواء كنت تستخدم السجلات العشرة الأساسية أو السجلات الطبيعية ، لأنها تختلف بعامل ثابت ، فاللوغاريتم الأساسي 10 لرقم هو فقط 2.303 & hellip & مرات اللوغاريتم الطبيعي للرقم. يجب عليك تحديد السجل الذي تستخدمه عند كتابة النتائج ، حيث سيؤثر ذلك على أشياء مثل المنحدر والاعتراض في الانحدار. أفضل السجلات العشرة الأساسية ، لأنه من الممكن النظر إليها ومعرفة حجم الرقم الأصلي: السجل (1) = 0 ، السجل (10) = 1 ، السجل (100) = 2 ، إلخ.

التحول الخلفي هو رفع 10 أو ه إلى قوة الرقم إذا كان متوسط ​​البيانات المحولة من السجل 10 الأساسي هو 1.43 ، والمتوسط ​​المحول الخلفي هو 10 1.43 = 26.9 (في جدول بيانات ، "= 10 ^ 1.43"). إذا كان متوسط ​​البيانات المحولة من السجل الإلكتروني الأساسي الخاص بك هو 3.65 ، فإن المتوسط ​​الذي تم تحويله للخلف هو ه 3.65 = 38.5 (في جدول بيانات ، "= EXP (3.65)". إذا كان لديك أصفار أو أرقام سالبة ، فلا يمكنك أخذ السجل ، فيجب عليك إضافة ثابت لكل رقم لجعلها موجبة وغير صفرية. إذا تحتوي على بيانات العد ، وبعض الأعداد صفر ، والاتفاقية هي إضافة 0.5 إلى كل رقم.

العديد من المتغيرات في علم الأحياء لها توزيعات لوغاريتمية عادية ، مما يعني أنه بعد التحويل اللوغاريتمي ، يتم توزيع القيم بشكل طبيعي. هذا لأنك إذا أخذت مجموعة من العوامل المستقلة وضربتها معًا ، فإن الناتج الناتج يكون عاديًا. على سبيل المثال ، لنفترض أنك زرعت مجموعة من بذور القيقب ، وبعد 10 سنوات ترى ارتفاع الأشجار. سيتأثر ارتفاع الشجرة الفردية بالنيتروجين الموجود في التربة ، وكمية المياه ، وكمية ضوء الشمس ، وكمية أضرار الحشرات ، وما إلى ذلك. قد يؤدي وجود المزيد من النيتروجين إلى جعل الشجرة أكبر بنسبة 10٪ من تلك التي تحتوي على كمية أقل من النيتروجين والكمية المناسبة من الماء قد يجعلها أكبر بنسبة 30٪ من واحدة بها كمية كبيرة جدًا أو قليلة جدًا من الماء ، وقد يؤدي المزيد من ضوء الشمس إلى جعلها أكبر بنسبة 20٪ ، وقد يجعلها أقل ضررًا للحشرات أكبر بنسبة 15٪ ، وما إلى ذلك. وبالتالي فإن الحجم النهائي للشجرة سيكون دالة على النيتروجين والماء والوقت وضوء الشمس والحشرات الزمنية ، ورياضيا ، هذا النوع من الوظائف هو لوغاريتمي عادي.

تحويل الجذر التربيعي. يتكون هذا من أخذ الجذر التربيعي لكل ملاحظة. التحويل الخلفي هو تربيع الرقم. إذا كانت لديك أرقام سالبة ، فلا يمكنك أخذ الجذر التربيعي ، بل يجب عليك إضافة ثابت لكل رقم لجعلها جميعًا موجبة.

غالبًا ما يستخدم الناس تحويل الجذر التربيعي عندما يكون المتغير عددًا لشيء ما ، مثل المستعمرات البكتيرية لكل طبق بتري ، وخلايا الدم التي تمر عبر الشعيرات الدموية في الدقيقة ، والطفرات لكل جيل ، وما إلى ذلك.

تحول القوس. يتكون هذا من أخذ قوس جيب الجذر للجذر التربيعي لرقم. (تُعطى النتيجة بالراديان ، وليس بالدرجات ، ويمكن أن تتراوح من & ناقص & pi / 2 إلى & pi / 2.) يجب أن تكون الأرقام المراد تحويلها قوسًا في النطاق من 0 إلى 1. وهذا شائع الاستخدام للنسب التي تتراوح من 0 إلى 1 ، مثل نسبة إناث طين الطمي الشرقي المصابة بطفيلي. لاحظ أن هذا النوع من النسبة هو في الحقيقة متغير اسمي ، لذلك من غير الصحيح معاملته كمتغير قياس ، سواء قمت بتحويله أم لا. على سبيل المثال ، سيكون من غير الصحيح حساب عدد أقواس الطين التي تتطفل أو لا تتطفل على كل من التيارات المتعددة في ولاية ماريلاند ، ومعالجة النسبة المحولة من القوسين للإناث المصابات في كل تيار كمتغير قياس ، ثم إجراء الانحدار الخطي على هذه البيانات مقابل عمق التدفق. وذلك لأن النسب من الجداول ذات حجم عينة أصغر من الأسماك سيكون لها انحراف معياري أعلى من النسب من الجداول التي تحتوي على عينات أكبر من الأسماك ، وهي المعلومات التي يتم تجاهلها عند التعامل مع النسب المحولة في شكل قوس كمتغيرات قياس. بدلاً من ذلك ، يجب أن تستخدم اختبارًا مصممًا للمتغيرات الاسمية في هذا المثال ، يجب أن تفعل الانحدار اللوجستي بدلاً من الانحدار الخطي. إذا أصررت على استخدام التحويل القوسي ، على الرغم مما أخبرتك به للتو ، فإن التحويل الخلفي هو تربيع جيب الرقم.

كيفية تحويل البيانات

جدول

في عمود فارغ ، أدخل الوظيفة المناسبة للتحويل الذي اخترته. على سبيل المثال ، إذا كنت تريد تحويل الأرقام التي تبدأ في الخلية A2 ، فستنتقل إلى الخلية B2 وأدخل = LOG (A2) أو = LN (A2) لتسجيل التحويل ، = SQRT (A2) لتحويل الجذر التربيعي ، أو = ASIN (SQRT (A2)) لتحويل القوس. ثم انسخ الخلية B2 والصقها في جميع الخلايا الموجودة في العمود B بجوار الخلايا الموجودة في العمود A التي تحتوي على بيانات. لنسخ ولصق القيم المحولة في جدول بيانات آخر ، تذكر استخدام الأمر "لصق خاص." ، ثم اختر لصق "القيم". باستخدام الأمر "لصق خاص. قيم" يجعل Excel ينسخ النتيجة الرقمية للمعادلة ، بدلاً من المعادلة نفسها. (إذا كان جدول البيانات الخاص بك هو Calc ، فاختر "لصق خاص" من قائمة "تعديل" ، وألغ تحديد المربعين المسمى "لصق الكل" و "الصيغ" ، وحدد المربع المسمى "الأرقام".)

لإعادة تحويل البيانات ، فقط أدخل معكوس الوظيفة التي استخدمتها لتحويل البيانات. لإعادة تحويل بيانات السجل المحولة في الخلية B2 ، أدخل = 10 ^ B2 للسجلات الأساسية 10 أو = EXP (B2) للسجلات الطبيعية للبيانات المحولة الجذر التربيعي ، أدخل = B2 ^ 2 للبيانات المحولة في شكل قوس ، أدخل = ( SIN (B2)) ^ 2

صفحات الانترنت

لست على علم بأي صفحات ويب ستقوم بتحويل البيانات.

لتحويل البيانات في SAS ، اقرأ البيانات الأصلية ، ثم أنشئ متغيرًا جديدًا بالوظيفة المناسبة. يوضح هذا المثال كيفية إنشاء متغيرين جديدين ، تحويل الجذر التربيعي والسجل المحول ، من بيانات mudminnow.

تحتوي مجموعة البيانات "mudminnow" على جميع المتغيرات الأصلية ("location" و "banktype" و "count") بالإضافة إلى المتغيرات الجديدة ("countlog" و "countsqrt"). ثم تقوم بتشغيل أي عملية PROC تريدها وتحلل هذه المتغيرات تمامًا كما تفعل مع أي متغيرات أخرى. بالطبع ، هذا المثال يقوم بتحويلين مختلفين فقط كتوضيح في الواقع ، يجب أن تقرر تحويل واحد قبل أن تقوم بتحليل بياناتك.

وظيفة SAS لتحويل القوس X هي ARSIN (SQRT (X)).

من المحتمل أن تجد أنه من الأسهل إجراء التحويل العكسي باستخدام جدول بيانات أو آلة حاسبة ، ولكن إذا كنت تريد فعل كل شيء في SAS ، فإن وظيفة نقل 10 إلى X هي وظيفة 10 ** X ه إلى قوة هي EXP (X) ، فإن وظيفة تربيع X هي X ** 2 ووظيفة التحويل العكسي لرقم محوّل قوسي هي SIN (X) ** 2.

المرجعي

& lArr الموضوع السابق | الموضوع التالي & rArr جدول المحتويات

تم إجراء آخر مراجعة لهذه الصفحة في 18 ديسمبر 2015. عنوانها هو http://www.biostathandbook.com/transformation.html. يمكن أن يقتبس على النحو التالي:
ماكدونالد ، ج. 2014. كتيب الإحصاءات البيولوجية (الطبعة الثالثة). دار سباركي للنشر ، بالتيمور ، ماريلاند. تحتوي صفحة الويب هذه على محتوى الصفحات 140-144 في النسخة المطبوعة.

& copy2014 بواسطة John H. McDonald. ربما يمكنك فعل ما تريد باستخدام هذا المحتوى ، راجع صفحة الأذونات للحصول على التفاصيل.


دراسة الديناميات السكانية

تتم دراسة الديموغرافيا ، أو دراسة ديناميات السكان ، باستخدام أدوات مثل جداول الحياة ومنحنيات البقاء على قيد الحياة.

أهداف التعلم

يميز بين جداول الحياة ومنحنيات البقاء على قيد الحياة كما هو مستخدم في الديموغرافيا

الماخذ الرئيسية

النقاط الرئيسية

  • الإحصاءات الرئيسية المستخدمة في الديموغرافيا هي معدلات المواليد ومعدلات الوفيات ومتوسط ​​العمر المتوقع التي قد تتأثر بخصائص السكان والعوامل البيولوجية.
  • معدلات المواليد ومعدلات الوفيات ومتوسط ​​العمر المتوقع هي المحددات الأساسية لكيفية تغير السكان بمرور الوقت.
  • جداول الحياة هي أدوات ديموغرافية توضح متوسط ​​العمر المتوقع للسكان و # 8217 ومعدل الوفيات ضمن الفئات العمرية.
  • منحنى البقاء على قيد الحياة هو رسم بياني لعدد الأفراد الذين بقوا على قيد الحياة في كل فترة عمرية مقابل الوقت.
  • تحدد خصائص وسلوك النوع ، مثل عدد النسل المنتج ، ونسبة النسل الباقي على قيد الحياة ، ودرجة رعاية الوالدين ، شكل منحنى بقائه على قيد الحياة.

الشروط الاساسية

  • جدول الحياة: أداة ديموغرافية توضح متوسط ​​العمر المتوقع للسكان و # 8217 ومعدل الوفيات ضمن الفئات العمرية
  • منحنى النجاة: رسم بياني لعدد الأفراد الذين بقوا على قيد الحياة في كل فترة عمرية مقابل الوقت
  • معدل الوفيات: عدد الوفيات لكل وحدة سكانية معينة خلال فترة زمنية معينة

الديموغرافيا

يصف حجم السكان وكثافتهم وأنماط التوزيع السكان في نقطة زمنية ثابتة. لدراسة كيفية تغير السكان بمرور الوقت ، يجب على العلماء استخدام أدوات الديموغرافيا: الدراسة الإحصائية للتغيرات السكانية بمرور الوقت. الإحصائيات الرئيسية التي يستخدمها علماء الديموغرافيا هي معدلات المواليد ، ومعدلات الوفيات ، ومتوسط ​​العمر المتوقع ، على الرغم من أن العلماء ، في الممارسة العملية ، يدرسون أيضًا معدلات الهجرة والهجرة ، والتي تؤثر أيضًا على السكان.

قد تكون هذه المقاييس ، وخاصة معدلات المواليد ، مرتبطة بخصائص السكان الموصوفة في الأقسام السابقة. على سبيل المثال ، سيكون معدل المواليد مرتفعًا نسبيًا لعدد كبير من السكان إذا كان لديهم عدد أكبر من الأفراد الإنجاب. بدلاً من ذلك ، قد يكون لدى عدد كبير من السكان أيضًا معدل وفيات مرتفع بسبب المنافسة أو المرض أو تراكم النفايات. قد تؤدي الكثافة السكانية العالية إلى المزيد من اللقاءات التناسلية بين الأفراد ، كما هو الحال مع نمط التوزيع المتكتل. مثل هذه الظروف من شأنها أن تزيد من معدل المواليد.

تؤثر السمات البيولوجية للسكان أيضًا على التغيرات السكانية بمرور الوقت. ستكون معدلات المواليد أعلى في مجموعة سكانية مع انحياز نسبة الذكور إلى الإناث تجاه الإناث ، أو في مجموعة تتكون من عدد أكبر نسبيًا من الأفراد في سن الإنجاب.

الخصائص الديموغرافية للسكان هي المحددات الأساسية لكيفية تغير السكان بمرور الوقت. إذا تساوت معدلات المواليد والوفيات ، يظل السكان مستقرين. سيزداد عدد السكان إذا تجاوزت معدلات المواليد معدلات الوفيات ، ولكنها ستنخفض إذا كانت معدلات المواليد أقل من معدلات الوفيات. متوسط ​​العمر المتوقع ، عامل مهم آخر ، هو طول الفترة الزمنية التي يبقى فيها الأفراد بين السكان. يتأثر بالموارد المحلية والتكاثر والصحة العامة للسكان. غالبًا ما يتم عرض هذه الخصائص الديموغرافية في شكل جدول الحياة.

جداول الحياة

جداول الحياة ، التي توفر معلومات مهمة حول تاريخ حياة الكائن الحي ، تقسم السكان إلى مجموعات عمرية ، وغالبًا ما تُظهر الأجناس المدة التي قد يعيشها أحد أفراد هذه المجموعة. تم تصميم الجداول على غرار الجداول الاكتوارية المستخدمة من قبل صناعة التأمين لتقدير متوسط ​​العمر المتوقع للإنسان. قد تشمل جداول الحياة:

  • احتمال وفاة الأفراد قبل عيد ميلادهم التالي (أي معدل الوفيات)
  • النسبة المئوية للأفراد الأحياء في فترة عمرية معينة
  • متوسط ​​العمر المتوقع في كل فترة

جدول الحياة المعروض مأخوذ من دراسة لأغنام جبل دال ، وهي نوع موطنه الأصلي شمال غرب أمريكا الشمالية. يتم تقسيم السكان إلى فترات عمرية ، كما هو موضح في العمود الموجود في أقصى اليسار. يُحسب معدل الوفيات لكل 1000 فرد بقسمة عدد الأفراد الذين يموتون خلال فترة عمرية على عدد الأفراد الذين بقوا على قيد الحياة في بداية الفترة ، مضروبًا في 1000.

جدول الحياة لأغنام جبل دال: جدول الحياة هذا Ovis dalli يوضح عدد الوفيات وعدد الناجين ومعدل الوفيات ومتوسط ​​العمر المتوقع في كل فترة عمرية لأغنام جبل دال.

على سبيل المثال ، بين سن الثالثة والرابعة ، يموت 12 فردًا من أصل 776 خروفًا كانت متبقية من الألف خروف الأصلي. ثم يتم ضرب هذا الرقم في 1000 للحصول على معدل الوفيات لكل ألف.

كما يتضح من بيانات معدل الوفيات (العمود D) ، حدث معدل وفيات مرتفع عندما كانت الأغنام تتراوح بين 6 و 12 شهرًا ، والتي زادت بعد ذلك أكثر من 8 إلى 12 عامًا ، وبعد ذلك كان هناك عدد قليل من الناجين. تشير البيانات إلى أنه إذا كان الخروف في هذه المجموعة سيبقى على قيد الحياة حتى سن واحد ، فمن المتوقع أن يعيش 7.7 سنة أخرى في المتوسط ​​، كما هو موضح في أرقام متوسط ​​العمر المتوقع في العمود E.

منحنيات البقاء على قيد الحياة

أداة أخرى يستخدمها علماء البيئة السكانية هي منحنى البقاء على قيد الحياة ، وهو رسم بياني لعدد الأفراد الذين بقوا على قيد الحياة في كل فترة عمرية مقابل الوقت (عادةً مع البيانات المجمعة من جدول الحياة). تسمح هذه المنحنيات بمقارنة تواريخ حياة المجموعات السكانية المختلفة.

تظهر منحنيات البقاء على قيد الحياة توزيع الأفراد في مجموعة سكانية حسب العمر: لدى البشر ومعظم الثدييات منحنى البقاء على قيد الحياة من النوع الأول لأن الموت يحدث بشكل أساسي في السنوات الأكبر سنًا. الطيور لديها منحنى البقاء على قيد الحياة من النوع الثاني ، حيث أن الموت في أي عمر هو احتمال متساوٍ. تمتلك الأشجار منحنى البقاء من النوع الثالث لأن عددًا قليلاً جدًا منها بقي على قيد الحياة في سنوات الشباب ، ولكن بعد سن معينة ، يكون الأفراد أكثر عرضة للبقاء على قيد الحياة.

يُظهر البشر ومعظم الرئيسيات منحنى البقاء على قيد الحياة من النوع الأول لأن نسبة عالية من الأبناء ينجوون في السنوات المبكرة والمتوسطة من الموت يحدث في الغالب في الأفراد الأكبر سنًا. هذه الأنواع لديها عدد قليل من النسل لأنها تستثمر في رعاية الوالدين لزيادة البقاء على قيد الحياة.

تُظهر الطيور منحنى البقاء على قيد الحياة من النوع الثاني لأن أعدادًا متساوية من الطيور تميل إلى الموت في كل فترة عمرية. قد يكون لهذه الأنواع أيضًا نسل قليل نسبيًا وتوفر رعاية أبوية كبيرة.

تظهر الأشجار واللافقاريات البحرية ومعظم الأسماك منحنى البقاء من النوع الثالث. عدد قليل جدًا من الأفراد ينجو من سنوات الشباب ، ومع ذلك ، فمن المرجح أن يعيش أولئك الذين يعيشون حتى سن الشيخوخة لفترة طويلة نسبيًا. عادة ما يكون للكائنات الحية في هذه الفئة أعداد كبيرة من النسل ولا تقدم سوى القليل من الرعاية الأبوية. هذا النسل هو & # 8220 على & # 8221 ويعاني من ارتفاع معدل الوفيات بسبب الافتراس أو الجوع ، ومع ذلك ، فإن وفرة هذه النسل تضمن بقاء عدد كافٍ من الأفراد على قيد الحياة للجيل التالي ، مما يديم السكان.


الازدواجية والحذف

بالإضافة إلى فقدان أو اكتساب كروموسوم كامل ، قد يتضاعف جزء الكروموسومات أو يُفقد. غالبًا ما ينتج عن الازدواجية والحذف ذرية تبقى على قيد الحياة ولكنها تظهر تشوهات جسدية وعقلية. قد تندمج مقاطع الكروموسومات المضاعفة مع الكروموسومات الموجودة أو قد تكون حرة في النواة. Cri-du-chat (من الفرنسية لـ & # 8220cry of the cat & # 8221) هي متلازمة مرتبطة باضطرابات الجهاز العصبي والسمات الجسدية المحددة التي تنتج عن حذف معظم 5p (الذراع الصغيرة للكروموسوم 5) (الشكل 5). يُصدر الأطفال الذين لديهم هذا النمط الجيني صرخة مميزة عالية النبرة يعتمد عليها اسم الاضطراب & # 8217s.

الشكل 5. يظهر هذا الفرد المصاب بمتلازمة cri-du-chat في عمر سنتين وأربعة وتسعة و 12 عامًا. (الائتمان: باولا شيروتي ميناردي)


الكروموسومات الجنسية

ما الذي يمكن أن يحدث بشكل خاطئ في الكروموسومات الجنسية ، إن وُجد؟ بدلاً من اكتساب أو فقدان الجسيمات الذاتية ، ترتبط الاختلافات في عدد الكروموسومات الجنسية بتأثيرات خفيفة نسبيًا. يحدث هذا بسبب عملية جزيئية تسمى تعطيل X. في وقت مبكر من التطور عندما تتكون أجنة الثدييات الأنثوية من بضعة آلاف من الخلايا ، يتم تعطيل كروموسوم X واحد في كل خلية عن طريق التكثيف بإحكام في بنية نائمة تسمى جسم بار. إن احتمال تعطيل كروموسوم X ، من أي من الوالدين ، في كل خلية هو أمر عشوائي ، ولكن بمجرد حدوث التعطيل ، فإن جميع الخلايا المشتقة من ذلك الشخص سيكون لها نفس الكروموسوم X غير النشط أو جسم Barr. من خلال هذه العملية ، تعوض الإناث عن جرعتها الجينية المزدوجة من الكروموسوم X.

الشكل 5. في القطط ، يقع جين لون المعطف على الكروموسوم X. في التطور الجنيني للقطط الأنثوية ، يتم تعطيل أحد الكروموسومات X بشكل عشوائي في كل خلية ، مما ينتج عنه نمط صدف السلحفاة إذا كان القط لديه أليلين مختلفين للون المعطف. القطط الذكور ، التي لديها كروموسوم X واحد فقط ، لا تظهر أبدًا لون معطف صدف السلحفاة. (الائتمان: مايكل بوديجا)

يمكن ملاحظة ذلك في ما يسمى بقطط "صدف السلحفاة" حيث لوحظ تعطيل X الجنيني كتنوع في اللون (الشكل 5). سوف تعبر الإناث المتغايرة الزيجوت لجين لون المعطف المرتبط بـ X عن لون من لونين مختلفين للغطاء على مناطق مختلفة من الجسم ، بما يتوافق مع أي كروموسوم X غير نشط في الخلية الجنينية في تلك المنطقة.

الفرد الذي لديه عدد غير طبيعي من الكروموسومات X سوف يعطل جميع كروموسومات X باستثناء كروموسوم X واحد في كل خلية من خلاياه. ومع ذلك ، حتى الكروموسومات X المعطلة تستمر في التعبير عن عدد قليل من الجينات. نتيجة لذلك ، ترتبط تشوهات الكروموسومات X بعيوب عقلية وجسدية خفيفة وعقم. يمنع الغياب التام للكروموسوم X الفرد من النمو في الرحم.

لوحظت عدة أخطاء في عدد الكروموسومات الجنسية.

(1) Triplo-X female & # 8211 XXX أنثى تأخر النمو السريع قلل من الخصوبة

(2) متلازمة كلاينفيلتر & # 8211 XXY الخصيتين الصغيرتين الذكورية تضخم الثديين وتقلل من شعر الجسم

(3) متلازمة تيرنر & # 8211 X0 أنثى (كروموسوم جنس واحد فقط) جلد مكشوف قصير القامة في منطقة الرقبة ضعف السمع والقلب والعقم


أساليب

يمكن تقسيم نهجنا لتقدير الوفرة العالمية الخاصة بالأنواع لـ 9700 نوع إلى خمس خطوات رئيسية ، تم توضيحها بدورها أدناه (الشكل 1):

• الخطوة 1 (بيانات التدريب): نمذجة العلاقة بين تقديرات الكثافة المعروفة (أي أفضل البيانات المتاحة التي تم التحقق من صحتها خارجيًا) والوفرة النسبية من eBird لاشتقاق نموذج تدريب خاص بالأنواع ، مع تضمين الخطأ المعروف في تقديرات الوفرة النسبية.

• الخطوة 2 (بيانات الحصر): احسب مقياس الوفرة النسبية لجميع الأنواع في خلايا شبكية 5 درجات في جميع أنحاء العالم. بالنسبة لأنواع التدريب ، احسب الكثافة باستخدام النتائج من الخطوة 1 في كل شبكة فريدة يشغلها النوع.

• الخطوة 3 (سمات تاريخ الحياة): جمع سمات تاريخ الحياة (لون الطيور ، حجم القطيع ، حجم الجسم ، وحالة الاتحاد الدولي للحفاظ على الطبيعة [IUCN]) التي من المحتمل أن تؤثر على العلاقة بين السكان الحقيقيين للأنواع و الوفرة النسبية للأنواع المحسوبة من خلال eBird.

• الخطوة 4 (التضمين المتعدد): إجراء احتساب متعدد بواسطة معادلات متسلسلة للتنبؤ بكثافة الأنواع وعدم اليقين الخاص بها لكل خلية شبكة ، بناءً على العلاقة المعروفة بين الكثافة المقدرة والوفرة النسبية المرصودة لأنواع التدريب لدينا والسمات المجمعة في الخطوة 3.

• الخطوة 5 (حساب الوفرة): استخدم الكثافات وأوجه عدم اليقين المتوقعة لاشتقاق تقدير متوسط ​​الكثافة العالمية لكل نوع واضرب تقدير الكثافة هذا في المنطقة المرصودة لأحد الأنواع - مع الاستقراء عند الضرورة والإمكان - لحساب الوفرة العالمية المحاكاة توزيع.

في الطرق التالية ، نتوسع في كل خطوة من هذه الخطوات الرئيسية.

بيانات التدريب.

تقديرات الوفرة.

كان هدفنا الرئيسي هو تحديد كثافة أنواع الطيور في جميع أنحاء العالم. أساسي للكثافة هو مقياس الوفرة المطلقة - الكمية المعروفة أو المقدرة للأفراد في مجموعة سكانية. يعد تقدير الحجم الإجمالي للسكان لمجموعة حيوانات معينة سؤالًا بحثيًا أساسيًا في علم البيئة والحفظ (58). لقد بحثت الكثير من الأبحاث في كيفية تقدير الوفرة المطلقة على أفضل وجه ، مع تطبيق العديد من التقنيات لتقدير الوفرة (59 ، 60). عندما تُعرف الوفرة لمنطقة ما ، تكون الكثافة ببساطة: D e n s i t y = A b u n d a n c e A r e a.

وبالتالي ، من أجل تحليلنا ، كان من الأهمية بمكان العثور على تقديرات سكانية خارجية لها وفرة سكانية مقدرة لمنطقة جغرافية معينة. نظرًا لأن معظم مخططات الإبلاغ مستمدة من مبادرة حكومية لفهم الأنواع الأكثر تعرضًا للخطر (61) ، فإن معظم التقديرات السكانية تستند إلى الحدود الجيوسياسية ، ومن ثم يتم توسيع نطاق المجموعات السكانية الخاصة بالأنواع بناءً على استقراء حجم النطاق. وبالتالي اعتمد تحليلنا ، إلى حد ما ، على السكان داخل الحدود الجيوسياسية. استخدمنا تقديرات الوفرة المنشورة من ثلاثة مصادر: 1) الشركاء في قاعدة بيانات تقديرات سكان الطيران (62) 2) تقديرات السكان من الصندوق البريطاني لعلم الطيور (63) و 3) من منطقة بيانات BirdLife International datazone.birdlife.org/home. قمنا بتجميع ما مجموعه 724 نوعًا قدّرنا وفرة السكان فيها. تم حساب وفرة كل نوع من أنواع التدريب إما في الحدود الجيوسياسية (على سبيل المثال ، للأنواع المستخرجة من قاعدة بيانات Partners in Flight و British Trust for Ornithology) أو عبر النطاق الجغرافي بأكمله (على سبيل المثال ، للأنواع المستخرجة من منطقة بيانات حياة الطيور). على سبيل المثال ، كانت التقديرات من قاعدة بيانات Partners in Flight متاحة على طبقات لكل ولاية ومنطقة حماية الطيور في جميع أنحاء الولايات المتحدة حيث تم العثور على هذه الأنواع. يتم التعامل مع كل مصدر من مصادر البيانات هذه بمزيد من التفصيل في الملحق SI, طرق SI.

تقديرات الوفرة النسبية.

استخرجنا تقديرات الوفرة النسبية من بيانات علم المواطن eBird (36 ، 64). هنا ، حددنا الوفرة النسبية لتعني عدد الطيور التي تمت ملاحظتها لكل وحدة جهد (على سبيل المثال ، الوقت و / أو المسافة). تم إطلاق eBird في عام 2002 من قبل مختبر كورنيل لعلم الطيور ولديها حاليًا & GT800 مليون رصد للطيور العالمية. مراقبو الطيور المتطوعون يقدمون "قوائم مراجعة" للطيور التي شوهدت و / أو سمعت أثناء مراقبة الطيور. يتم تمييز الأنواع ، أو أعداد الأنواع ، غير المتوقعة بناءً على الإحداثيات الزمانية المكانية للملاحظات ، ومراجعتها بواسطة شبكة واسعة من المتطوعين الخبراء قبل قبولهم في مجموعة البيانات (65). يتم وضع علامة على كل قائمة مرجعية على أنها إما "كاملة" أو "غير كاملة" من قبل مراقبي الطيور المتطوعين الذين يرسلون البيانات. يشير هذا التمييز إلى ما إذا كانوا يقدمون قائمة كاملة بجميع الطيور التي شوهدت و / أو سمعت خلال فترة المراقبة الخاصة بهم. استخدمنا فقط قوائم المراجعة الكاملة في تحليلنا لأن هذا يسمح باستنتاج حالات الغياب (أي عدم الاكتشاف). لتحليلنا ، استخدمنا مجموعة البيانات الأساسية eBird (الإصدار ebd_relMay2019). قمنا بتجميع بيانات eBird من يناير 2010 إلى مايو 2019. نحن نقر بأن بعض الأنواع قد تشهد تغيرات في أحجام عشائرها خلال هذا الوقت ، لكننا نلاحظ أن 10 سنوات هي المدة الموصى بها من قبل الاتحاد الدولي لحفظ الطبيعة (IUCN) لحساب التغير السكاني عندما يكون وقت التوليد غير معروف ( 66). لمزيد من التأكد من أن هذه البيانات تمثل بيانات "أفضل جودة" ، استخدمنا مجموعة إضافية من التصفية ، بهدف إزالة "القيم المتطرفة" المحتملة التي يمكن أن تؤدي إلى تحيز مجموعة البيانات الخاصة بنا (67 ⇓ –70). قمنا فقط بتضمين قوائم المراجعة الكاملة وقوائم المراجعة و GT5 min و & lt240 min في المدة ، وقوائم المراجعة التي سافرنا لمسافة 5 كيلومترات. ومع ذلك ، لا تزال بعض الأخطاء المحتملة ممكنة في مجموعة بيانات eBird (انظر المثال أدناه).

حتى الآن ، تم استخدام بيانات eBird لمجموعة متنوعة من التدابير المتعلقة بالوفرة. النهج العام هو قياس "الوفرة النسبية": عدد الطيور التي يتم عدها عند حساب الوقت الذي يقضيه في مراقبة الطيور والمسافة المقطوعة أثناء مراقبة الطيور. على سبيل المثال ، يقوم مختبر كورنيل لعلم الطيور حاليًا بنماذج الوفرة النسبية في المكان والزمان لـ & gt800 من الأنواع الأكثر شيوعًا في أمريكا الشمالية وأماكن أخرى: https://ebird.org/science/status-and-trends/. نظرًا لأن نهجنا العام كان قائمًا على الحدود الجيوسياسية ، وستكون هناك أعداد مختلفة تمامًا من البيانات المتاحة بين الحدود الجيوسياسية المختلفة (انظر الولايات المتحدة الأمريكية وجزيرة إندونيسية نائية) ، فقد هدفنا إلى نهج نمذجة بسيط وقابل للتتبع يمكن تعميمه على أي مكان يتم جمع بيانات eBird. على هذا النحو ، بعد الاستكشاف الأولي (الملحق SI، التين. S7 و طرق SI) ، استخدمنا متوسط ​​الوفرة عبر جميع قوائم المراجعة (بما في ذلك قوائم المراجعة عندما لم يتم تحديد نوع الأصفار) كمقياس للوفرة النسبية.

نمذجة العلاقة بين الكثافة والوفرة النسبية.

باستخدام تقديرات الوفرة المعروفة من المصادر الخارجية الموضحة أعلاه ، قمنا بحساب الكثافة لكل منطقة جيوسياسية أو نطاق الأنواع (الملحق SI، الشكل S8) المقابل لمقياس الوفرة النسبي من eBird. تم تحويل كل من الوفرة النسبية والكثافة إلى log10 ، وتم تعيين أي قيم كانت صفرًا في البداية (على سبيل المثال ، لم يتم اكتشافها في eBird ولكنها موجودة في مصادر البيانات الخارجية) على −4.5 (مقياس log10) نظرًا لأن القيمة الدنيا كانت −4.499787 في مجموعة البيانات (الملحق SI، الشكل S9). لقد تحققنا كميًا من حساسية تضمين هذه الأصفار في التأثير الكلي لنموذجنا ووجدنا أن الاعتراضات العشوائية والمنحدرات للأنواع التي تم الاحتفاظ بها كانت قوية عند إزالة بعض الملاحظات ، وبالتالي ، اخترنا تضمين الأصفار في نموذجنا عملية التركيب ، كما هو موضح أعلاه. لقد تركنا مع ما مجموعه 8735 نقطة بيانات من 724 نوعًا كان لمعظم الأنواع فيها ملاحظة واحدة فقط في النموذج ، لكن بعض الأنواع لديها العديد من الملاحظات نسبيًا المستخدمة في النموذج (الملحق SI، تين. S10 و S11). قمنا بعد ذلك بتركيب نموذج منحدر عشوائي بايزي ذو التأثيرات المختلطة باستخدام حزمة R (71 ، 72) ، وهو عبارة عن غلاف يلائم نماذج Bayesian في ستان (73) عبر rstan (74). هذا النموذج مكافئ لنموذج الانحدار من النوع الثاني ، والذي قمنا فيه صراحة بنمذجة الخطأ في مقاييس الوفرة النسبية الخاصة بـ eBird. تم حساب الخطأ في مقاييس الوفرة النسبية لـ eBird باعتباره SD لجميع تقديرات المتوسط ​​(أي ، SE) لوقت نوع معين (أي شهر) مضروبًا في المساحة (أي المنطقة الجيوسياسية) لمقاييس الوفرة المتوسطة ، مع عينة صغيرة تصحيح الحجم ، متبوعًا بطريقة دلتا لتحويل هذا إلى مقياس لوغاريتم 10. على الرغم من توفر تقديرات الخطأ لمعظم نقاط بيانات التدريب لدينا (أي تقدير الكثافة انظر أعلاه) ، فإن هذا غير متاح لجميع نقاط البيانات. لذلك ، قررنا عدم تضمين خطأ القياس هذا في متغير استجابتنا. هذا النهج هو 1) شامل من خلال السماح بإدراج المزيد من الأنواع في إجراء النمذجة من خلال عدم حذف الأنواع دون خطأ في بيانات التدريب و 2) متحفظ من خلال نشر كمية أكبر من SE المحيط بالتقاطع والمنحدر (أي عدم اليقين) إلى الأمام في إطار عمل النمذجة لدينا. استخدمنا كثافة log10 كمتغير استجابة والوفرة النسبية log10 كتأثير ثابت ، مع الأنواع مثل اعتراضات عشوائية والوفرة النسبية log10 كمنحدرات عشوائية مقابلة. استخدمنا 10000 تكرار وأربع سلاسل ، مع 2000 تكرار. استخدمنا المقدمات الافتراضية من brms التي تكون معلوماتية ضعيفة ، ولها تأثير ضئيل فقط على التقديرات ، مع تحسين التقارب وكفاءة أخذ العينات. في حالة التوزيع الغاوسي ، لدى سيجما نصف طالب ر قبل أن تقيس بنفس طريقة SDs على مستوى المجموعة (71 ، 72). من نموذج brms هذا ، قمنا باستخراج المنحدر العشوائي والتقاطع لكل نوع (الملحق SI، الشكل S12) ، والتي قدمت معادلة ذات معلمتين (ذ = مكس + ب) التي دلت على العلاقة بين الكثافة المرصودة للأنواع والوفرة النسبية من eBird (الملحق SI، تين. S9 – S12). بالإضافة إلى ذلك ، قمنا باستخراج SE (أي SDs للتوزيعات الخلفية) للاعتراض والمنحدر لكل نوع في مجموعة بيانات التدريب (الملحق SI، الشكل S12). من الضروري المضي قدمًا في هذه الأخطاء للاعتراضات العشوائية والمنحدرات حيث سيكون لكل نوع مقدار مختلف من الخطأ المرتبط باعتراضه وانحداره (75).

التحقق من صحة نموذج Brms.

استخدمنا تقديرًا تقريبيًا لمخرج واحد (76 ، 77) من حزمة brms للتحقق من تشخيصات نموذج brms الخاص بنا ووجدنا أن 95٪ من الملاحظات تحتوي على Pareto k & lt 0.7— في النطاق "موافق" (71 ، 76 ، 77) ، مما يشير إلى أنه يمكن اعتبار عدد قليل جدًا من نقاط البيانات "مؤثرًا" في عملية تركيب النموذج لدينا. A Bayesian تقريبي R 2 - تم حسابه على أنه تباين القيم المتوقعة مقسومًا على التباين في القيم المتوقعة بالإضافة إلى التباين المتوقع للأخطاء (78) - لهذا النموذج كان 0.78. لمزيد من التحقق من صحة نموذج brms المستخدم لاستخراج المنحدرات والاعتراضات الخاصة بالأنواع ، استخدمنا التقاطع والمنحدرات المستخرجة لكل نوع مع البيانات الأصلية المرصودة (انظر أساليب، أعلاه) لاختبار ما إذا كان نموذج brms يمكنه التنبؤ بدقة بالتقديرات الخارجية لمجموع الوفرة السكانية. وجدنا أن الاعتراضات والمنحدرات المستخرجة من brms تنبأت بشدة بتقديرات الوفرة لأنواع التدريب لدينا (الملحق SI، تين. S13 و S14) مع R 2 من 0.88. في النهاية ، وجدنا أن نموذج brms الخاص بنا كان قويًا لاستخراج تقديرات خاصة بالأنواع للاعتراض ، والمنحدر ، و SE للتقاطع والانحدار - انظر أدناه للتحقق من صحة سير العمل بشكل عام مما يوضح متانة هذا النموذج بشكل أكبر.

بيانات الاقتراب.

بعد أن قمنا بنمذجة العلاقة بين الكثافة المرصودة والوفرة النسبية ، فقد تركنا مع نموذج من معلمتين (ذ = مكس + ب) يصف هذه العلاقة الإحصائية التي تساعد في حساب الضوضاء في مقاييس الوفرة النسبية. ثم قمنا باشتقاق شبكة مكانية 5 × 5 ° تغطي العالم (الملحق SI، الشكل S15). استخدمنا الشبكات التي تحتوي على 50 قائمة تحقق eBird على الأقل في غضون شهر واحد على الأقل (الملحق SI، الشكل S16). داخل كل شبكة (N = 579) ، قمنا بحساب الوفرة النسبية لكل نوع على النحو المحدد أعلاه: متوسط ​​الوفرة في جميع قوائم المراجعة ، بما في ذلك الأصفار لقوائم المراجعة التي لم يتم العثور على الأنواع عليها. تم تقسيم هذا حسب الشهر. إذا لم يتم ملاحظة أحد الأنواع في شبكة (أي وفرة نسبية تبلغ 0) ، فإننا نفترض أن الأنواع غير موجودة في تلك الشبكة. باستخدام نموذجنا المكون من معلمتين ، والذي تضمن SEs لكل من التقاطع والمنحدر ، افترضنا أن الارتباط بين المنحدر والتقاطع سيكون −1 (الملحق SI، الشكل S13) هذا لأن التقاطع المبالغ فيه (التقاطعات الأعلى) سيؤدي دائمًا تقريبًا إلى منحدرات أقل عمقًا ، مما يؤدي إلى إنشاء ارتباط بين التقاطع والميل لـ 1. في ظل هذا الافتراض ، قمنا بحساب الكثافة - و SE - لـ 684 نوعًا من أنواع التدريب لدينا (على سبيل المثال ، الأنواع التي تم العثور عليها بعد استخدام معايير لتصفية الشبكات وقصرنا على العدد الإجمالي للأنواع التي سيتم تضمينها في مزيد من التحليلات) داخل كل منها الشبكة التي لوحظت فيها أنواع التدريب (الملحق SI، الشكل S17). بعد انهيار التباين بين الأشهر داخل كل شبكة إلى قيمة واحدة عن طريق حساب متوسط ​​الوفرة النسبية ، تركنا ما مجموعه 192،702 نوعًا × مجموعات شبكية. ما مجموعه 41652 من هؤلاء لديهم تقديرات كثافة عبر ما مجموعه 684 نوعًا.

بينما يحتوي مشروع eBird على بروتوكولات مراجعة قوية وصارمة (36 ، 64) وشبكة واسعة من المتطوعين الإقليميين (65) ، لا يزال من الممكن ارتكاب بعض الأخطاء والأخطاء. إذا كان أحد الأنواع متاحًا في إصدار مجموعة بيانات eBird الذي استخدمناه ، فإننا لم نقم بأي "تنظيف" للأخطاء المعروفة (أو المفترضة). على سبيل المثال ، توقعنا وفرة إيجابية من نقار الخشب المنقرض العاجي المعترف به إلى حد كبير لأنه كان هناك ملاحظات إيجابية عن هذا النوع في نسخة eBird التي استخدمناها (انظر أعلاه). لذلك ، يجب تفسير نتائجنا المقدمة في Dataset S1 بعناية بناءً على البيولوجيا المعروفة للأنواع والتوقعات السابقة (النص الرئيسي). ومع ذلك ، فإن eBird وغيرها من مجموعات البيانات العلمية للمواطنين تتزايد باستمرار من حيث الكمية والنوعية ، ويتم تصحيح هذه الأخطاء أو الأخطاء باستمرار في الإصدارات المحدثة من مجموعة البيانات.

سمات تاريخ الحياة.

كان هدفنا الرئيسي من خلال التضمين المتعدد هو احتساب تقديرات الكثافة المفقودة من خلال نمذجة العلاقة بين الكثافة المقدرة المستمدة من بيانات التدريب والوفرة النسبية للأنواع غير التدريبية. ومع ذلك ، فإن العلاقة بين الكثافة المرصودة والوفرة النسبية من قوائم مراجعة eBird (على سبيل المثال ، الشكل 1أ) من المحتمل أن تتأثر بمجموعة من سمات تاريخ حياة الأنواع. أظهر العمل السابق أن سمات الأنواع (على سبيل المثال ، حجم الجسم واللون وحجم المجموعة) يمكن أن تؤثر على قابلية اكتشاف الأنواع (79 ⇓ ⇓ ⇓ ⇓ -84) ، وبالتالي ، فإن احتمالية تسجيل الأنواع في المواطن مجموعة البيانات العلمية (85). سوليموس وآخرون. (81) وجونستون وآخرون. وجد (82) أن حجم الجسم كان مؤشرًا مهمًا لإمكانية اكتشاف أنواع الطيور. هناك أيضًا دعم بأن حجم المجموعة يمكن أن يؤثر على قابلية اكتشاف الحيوانات (83). على الرغم من صعوبة تحديده ، يُعتقد أن لون الكائن الحي يؤثر على قابلية اكتشافه (84). أخيرًا ، من المحتمل أيضًا أن تؤثر فئة الوفرة الإجمالية (على سبيل المثال ، الشائعة مقابل النادرة) للأنواع على قابلية اكتشاف الأنواع واحتمالية تسجيلها في مجموعة البيانات العلمية للمواطنين eBird (85). بناءً على الفهم البيولوجي أعلاه في قابلية الاكتشاف ، في افتراضنا ، قمنا بتضمين البيانات المساعدة حول ما يلي: لون الأنواع ، وحجم القطيع ، وحجم الجسم ، وحالة IUCN. بالنسبة للون ، استخدمنا مجموعة بيانات من & gt5000 نوع (86) وقمنا بحساب مقياسين منفصلين: السطوع والمسافة من اللون البني. بالنسبة لحجم القطيع ، استخدمنا eBird لحساب متوسط ​​حجم القطيع الإجمالي بين جميع التواجد في مجموعة البيانات لكل نوع. بالنسبة لحجم الجسم ، استخدمنا كتلة الجسم البالغة (بالجرام) كما تم استخلاصها من المرجع. 87. أخيرًا ، استخدمنا حالة IUCN للأنواع في التضمين (88) كمتغير ترتيبي ، مستخرج من قائمة عمل BirdLife International للنسخة 3 ، المتاحة هنا: datazone.birdlife.org/species/taxonomy.

قبل التضمين ، وجدنا بالفعل أن هذه السمات تتوافق بشكل معقول مع المكونات المختلفة (أي ، التقاطع أو المنحدر أو SE للتقاطع أو المنحدر) لإمكانية اكتشاف الأنواع بين الكثافة المرصودة والوفرة النسبية لـ eBird (الملحق SI، تين. S18 و S19). أظهر اعتراض الأنواع ارتباطًا قويًا بكتلة الجسم (ص = −0.467) وارتباط متوسط ​​مع اللون (ص = 0.101 و ص = 0.145 للمسافة من اللون البني والسطوع ، على التوالي). في حين أن حجم القطيع كان مرتبطا بشكل ضعيف مع القطع (ص = −0.086) ومترابطة بشكل معتدل مع المنحدر (ص = 0.146) ، فقد ارتبط ارتباطًا وثيقًا بـ SE للاعتراض (ص = −0.626) والانحدار (ص = −0.524). تم عرض نمط مشابه لحجم القطيع لحالة IUCN كمتغير ترتيبي. يمكن رؤية جميع الارتباطات الزوجية بين التقاطع ، والمنحدر ، و SE من التقاطع ، و SE للمنحدر ، وخصائص الأنواع في الملحق SI، الشكل S18. بعد أن قمنا بحساب الكثافة لأنواع التدريب ، باستخدام الاعتراضات والمنحدرات ، ظلت هناك علاقات معتدلة إلى قوية بين الوفرة النسبية والكثافة المقدرة وسمات تاريخ الحياة المختلفة (الملحق SI، الشكل S19) ، مشيرًا إلى أن سمات تاريخ الحياة من المرجح أن تلطف العلاقة بين الوفرة النسبية والكثافة.

تعدد البتر.

تضمنت مجموعة بيانات "التضمين" الخاصة بنا 192.702 صفًا (شبكة × نوعًا) مع 11 متغيرًا: 1) معرف الأنواع (0٪ مفقود) ، 2) عدد قوائم مراجعة eBird المحولة بالسجل (0٪ مفقودة) ، 3) عدد الأشهر أ الأنواع التي لوحظت في تلك الشبكة (0٪ مفقودة) ، 4) الوفرة النسبية كما هو موضح بالتفصيل أعلاه (0٪ مفقود) ، 5) حجم القطيع (0٪ مفقود) ، 6) حالة IUCN (8٪ مفقودة) ، 7) الجسم الحجم (16٪ مفقود) ، 8) مسافة اللون من البني (40٪ مفقود) ، 9) سطوع اللون (40٪ مفقود) ، 10) الكثافة المقدرة (79٪ مفقود) ، 11) SE للكثافة (79٪) مفقود). أظهرت هذه المتغيرات الـ 11 ارتباطات معتدلة إلى قوية (الملحق SI، تين. S18 و S19). كانت أهدافنا في التضمين هي الكثافة (على مستوى الشبكة المحدد) و SE (10 و 11) ، مستنيرًا بشكل أساسي من الوفرة النسبية (0 ٪ قيم مفقودة) ولكن ساعدت أيضًا المتغيرات المساعدة الخمسة (من 5 إلى 9). كانت هذه المتغيرات المساعدة ذات تغطية جيدة على سبيل المثال ، 79٪ من الصفوف (153،095) كان بها واحد على الأقل من هذه المتغيرات المساعدة. من بين المتغيرات ذات القيم المفقودة ، كانت الخمسة الأولى (من 5 إلى 9) متغيرات على مستوى الأنواع بينما كانت الأخيرة (10 و 11) على مستوى الملاحظة (الصف). استخدمنا فئران حزم R (89) و miceadds (90) لإجراء احتساب متعدد على مستويين حيث تم استخدام نماذج مختلطة مع عامل تجميع واحد (أي عشوائي) لحساب البيانات المفقودة باستخدام خوارزمية مطابقة تنبؤية (2 كلون. للمتغيرات على مستوى الأنواع و 2l.pmm لمتغيرات مستوى الملاحظة). في حالتنا ، كان عامل التجميع (أي العشوائي) هو النوع. أنشأنا 100 مجموعة بيانات منسوبة.

التحقق من صحة نموذج التضمين المتعدد.

للتحقق من صحة نهج نمذجة التضمين المتعدد ، أجرينا ثلاثة فحوصات مختلفة ، أوصي بها لتقييم موثوقية ومعقولية التضمين المتعدد (91 ، 92). أولاً ، أجرينا تقييمًا نوعيًا للفحص الخارجي ووجدنا عدم وجود تقديرات محتسبة غير معقولة بيولوجيًا (92). ثانيًا ، قمنا بمقارنة كثافة الملاحظات لبيانات التدريب وكثافة الملاحظات للبيانات المحتسبة. باستخدام 10 افتراضات تم اختيارها عشوائيًا - من إجمالي 100 افتراض أجريناها في تحليلنا - فحصنا بصريًا تقديرات الكثافة والكثافة المُحتملة مقارنةً بتقديرات الكثافة والكثافة المرصودة (الملحق SI، الشكل S20). وجدنا أن جميع الافتراضات العشرة المختارة عشوائياً تتطابق بشكل وثيق مع الكثافات المرصودة المستخدمة أثناء التضمين ، مما يشير إلى أن القيم المنسوبة معقولة من الناحية الإحصائية.ثالثًا ، أجرينا تحليل التحقق المتبادل الذي تم تركه مرة واحدة ، حيث تركنا كل نوع من أنواع التدريب لدينا خارجًا ، نظرًا لأن احتسابنا كان متداخلاً على مستوى الأنواع (على سبيل المثال ، تم التعامل مع الأنواع كتأثير عشوائي). وقت (على سبيل المثال ، الملحق SI، الشكل S21). بالنسبة لهذا التحليل ، تم تكرار كل عملية نمذجة احتساب كما هو موضح أعلاه ولكن مع 10 افتراضات فقط ، على عكس 100 افتراض استخدمناها في نموذجنا الكامل ، لأسباب حسابية. وجدنا أنه على مستوى الملاحظة ، يشمل نطاق التضمينات العشرة تقدير الكثافة المرصود لـ 95 ٪ من الملاحظات المنسوبة لمرة واحدة (على سبيل المثال ، الملحق SI، الشكل S21). وبالمثل ، فإن النطاق بين الكميات 0.05 و 0.95 من افتراضاتنا العشرة يشمل الكثافة المرصودة لـ 92٪ من الملاحظات. عند تقييم البيانات على مستوى الملاحظة ، كانت القدرة التنبؤية لطريقة الاحتساب الخاصة بنا لإسناد الكثافة قوية جدًا: كان نموذج التأثيرات المختلطة الخطي مع متغير الاستجابة ككثافة محسوبة ومتغير التنبؤ على أنه كثافة ملحوظة مع تأثير عشوائي للأنواع. أ هامشي R 2 من 0.84. عند أخذ تقديرات الكثافة المتوسطة بين الشبكات لكل نوع ، كان لدينا بالمثل قدرة تنبؤية قوية وكان للنموذج الخطي R 2 من 0.48 (الملحق SI، الشكل S22). بشكل عام ، أنتج افتراضنا المتعدد تقديرات موثوقة للكثافة ، ونلاحظ أيضًا أننا أخذنا في الحسبان SE لإجراء التضمين من خلال مزيد من التحليلات (انظر أدناه).

احسب الوفرة.

نظرًا لأن بعض الأنواع يمكن أن تحدث نادرًا جدًا في شبكة (على سبيل المثال ، مرة واحدة) ، مما يمثل ملاحظة خارج النطاق ، على سبيل المثال ، قمنا بتقييم كثافة الشبكة بعدد قوائم المراجعة التي تحدث فيها الأنواع في شبكة مقسومة على الرقم من إجمالي قوائم المراجعة في تلك الشبكة. يوفر هذا كثافة واحدة لكل نوع تمثل الكثافة التي يتم وزنها من الشبكات حيث يتم ملاحظة هذا النوع بشكل متكرر ، وبالتالي ، من المرجح أن تكون الكثافة أكثر موثوقية (الملحق SI، الشكل S23). بشكل عام ، يساعد انهيار كثافات الأنواع بين الشبكات إلى متوسط ​​الكثافة في حساب الاختلافات المعروفة في الكثافة عبر نطاق الأنواع (93) من خلال أخذ تقدير متوسط ​​الكثافة ، ودمج المناطق منخفضة الكثافة وعالية الكثافة للأنواع. ' نطاق. عبر 9700 نوعًا ، كان متوسط ​​عدد الشبكات التي يشغلها نوع ما 19 ، مع SD 36 (الملحق SI، الشكل S17). نلاحظ أن العديد من الأنواع توجد فقط في خلية شبكة واحدة ، وعلى الرغم من أن كثافتها قد تختلف في جميع أنحاء مداها ، إلا أننا لم نتمكن من حساب هذا التحيز المحتمل ، ولكن من المرجح أن تكون الاختلافات في الكثافة أكبر بالنسبة للأنواع ذات النطاقات الأكبر (93) ). قمنا أيضًا بحساب SEs المحسوبة للكثافة كجذر تربيعي لمجموع: 1) تباين التضمين للكثافة و 2) مربع متوسط ​​SEs المحسوبة ، مرجحًا بعدد قوائم المراجعة. نظرًا لأن بعض SEs كبيرة وغير معقولة بيولوجيًا قد لوحظت في البداية ، فقد وضعنا سلسلة من التلال مسبقًا لـ SE لكثافة 1 للكثافة المتوقعة ، والتي تعادل 91 مرة كثافة أعلى من تقدير نقطة الكثافة من حيث الثقة العليا حد. نحن نعتبر هذا قبل أن يكون متحفظًا ومن المحتمل أن يكون متحيزًا لتقديراتنا ، مما يؤدي إلى فترات ثقة كبيرة للغاية في بعض الحالات. وفقًا لذلك ، حصل كل نوع على تقدير متوسط ​​للكثافة (الملحق SI، الشكل S24) و SE بهذه الكثافة (الملحق SI، الشكل S25) في خلية شبكة معينة.

لكل نوع في مجموعة البيانات الخاصة بنا ، قمنا بحساب متوسط ​​تقدير الكثافة (على مقياس log10) لجميع خلايا الشبكة التي تم العثور على الأنواع فيها ، كما هو موضح أعلاه. قمنا بعد ذلك بحساب المساحة الإجمالية التي يشغلها كل نوع في تحليلنا عن طريق تلخيص مساحة عدد الخلايا الشبكية التي تم العثور على كل نوع فيها. ومع ذلك ، قمنا بتعديل هذه المناطق في اتجاهين ، اعتمادًا على حجم نطاق الأنواع. أولاً ، بالنسبة للأنواع ذات النطاقات الصغيرة نسبيًا والتي يمكن أن تكون أصغر من متوسط ​​حجم خلية الشبكة (24000 ميل مربع) ، قمنا بقص مساحة تلك الأنواع إلى حجم نطاقها المعروف (الملحق SI، الشكل S26 يظهر مثل هذا المثال). ثانيًا ، لأن بيانات eBird ليست متجانسة في جميع أنحاء العالم (على سبيل المثال ، الشكل 1ب) ، هناك العديد من الفجوات في خلايا الشبكة التي تم أخذ عينات منها (على سبيل المثال ، سيبيريا وأفريقيا—الملحق SI، الشكل S15). لذلك ، بالنسبة للأنواع التي لم يتم أخذ عينات النطاق المقدر لها بشكل كامل من خلال تحليل eBird الخاص بنا (على سبيل المثال ، الخلايا الشبكية المستخدمة لا تغطي نطاق هذا النوع بالكامل) ، استخدمنا مساحة النطاق الكلي - على عكس المساحة الإجمالية لـ شبكات تم العثور على نوع ما فيها - مع تقدير متوسط ​​الكثافة المرصود من تحليلنا. تم توفير نطاقات الأنواع المقدرة بواسطة BirdLife International. ومع ذلك ، نلاحظ أنه لم يكن لدينا بيانات عن نطاق كل الأنواع في تحليلنا نظرًا للاختلافات التصنيفية بين تصنيف Clements وتصنيف BirdLife International ونقص عام في البيانات لبعض الأنواع. لذلك ، لم يتم تعديل النطاق الخاص بنا لـ 2731 نوعًا ، وفي هذه الحالة افترضنا أن المساحة الإجمالية لخلايا الشبكة التي تم أخذ عينات منها تقارب إجمالي حجم نطاق الأنواع. ما إذا كان قد تم تعديل تقدير وفرة الأنواع بناءً على النطاق مذكور في مجموعة البيانات S1.

باستخدام تقدير متوسط ​​الكثافة (على مقياس لوغاريتم 10) وحجم نطاق الأنواع ، حصلنا بعد ذلك على تقديرات للوفرة ، ورسمنا 10000 رسم عشوائي من التوزيع الطبيعي مع تقدير متوسط ​​الكثافة و SE المقابل. حددنا وسيط هذا التوزيع (الشكل 1ه) باعتبارها الوفرة العالمية الخاصة بالأنواع. ونقوم أيضًا بالإبلاغ عن 95٪ من مجالات الموثوقية الأدنى والأعلى في مجموعة البيانات S1.

تكررت هذه الطريقة لكل الأنواع في تحليلنا (العدد = 9700). لتحديد العدد الإجمالي للطيور الفردية في العالم ، قمنا بتلخيص التوزيعات الخاصة بالأنواع كما هو موصوف أعلاه ، مع التأكد من أن التوزيعات قد تم ترتيبها قبل الجمع (على سبيل المثال ، يتم جمع أصغر القيم أو أكبر القيم أثناء قيامنا بدمج التوزيعات). من خلال ترتيب التوزيعات قبل الجمع ، تأكدنا من أن احتمالية القيم الخاصة بكل نوع تتوافق مع بعضها البعض ، وبالتالي ضمان أن القيم الوسطى تتوافق مع القيم ذات الاحتمالية الأعلى. بينما تم تنفيذ هذا النهج لكل الأنواع ، يمكننا أيضًا جمع التوزيعات الخاصة بالأنواع بناءً على أي تصنيف للأنواع (على سبيل المثال ، الجنس ، والعائلة ، والترتيب ، وعالم الجغرافيا الحيوية ، ونقابة التغذية) كما فعلنا في تحليلنا.

التحقق من سير العمل بشكل عام.

للتحقق من صحة سير العمل العام لدينا لحساب تقديرات الوفرة الخاصة بالأنواع ، قمنا بتنفيذ نهج التحقق المتبادل من عدم الخروج لمرة واحدة لأنواع التدريب البالغ عددها 684 نوعًا والتي تم تضمينها في كل من نموذج brms وخطوة الاحتساب المتعددة لتحليلنا. لكل نوع ، قمنا بإزالة تلك الأنواع من مجموعة التدريب الخاصة بنا وأعدنا إجراء التحليل - بما في ذلك نموذج brms ، ونموذج التضمين المتعدد ، والتوزيع المحاكي لتقديرات الوفرة. بالنسبة لهذه العملية ، لتجنب الاختناقات الحسابية ، تم تحديد نموذج brms نفسه ولكن تم تزويده بسلسلتين فقط ، و 3000 تكرار ، و 1000 تكرار ، بينما تم تركيب التضمين المتعدد على أكثر من 10 افتراضات في كل مرة (فحوصات نوعية لحفنة من أظهرت الأنواع اختلافات طفيفة عند استخدام المزيد من التكرارات و / أو الافتراضات). تمكنا بعد ذلك من تقدير توزيع الوفرة الخاص بالأنواع لكل نوع عندما تم تضمينه كنوع تدريب في سير العمل الكامل و 2) عندما تم حجبه تمامًا كنوع تدريب (على سبيل المثال ، الملحق SI، الشكل S27). في معظم الحالات ، كان توزيع تقديرات الوفرة المحتملة أوسع (أي فترات ثقة أوسع) عندما لم يتم تضمين أحد الأنواع في العملية ، مقارنةً بالوقت الذي تم فيه تضمينه في النموذج الكامل ، وفي بعض الحالات ، كانت التوزيعات متشابهة جدًا (الملحق SI، الشكل S27). الأهم من ذلك ، وجدنا ارتباطًا قويًا للغاية بين متوسط ​​وفرة السكان لكل نوع عند حجبه عن التحليل ومتوسط ​​الوفرة السكانية من النموذج الكامل عندما تم تضمين جميع الأنواع (الملحق SIS28) - مع R 2 من 0.94.

تقييم إشارة النشوء والتطور لتقديرات الوفرة على مستوى الأنواع.

باستخدام دالة phylosig من الحزمة R ، phytools (94) ، حسبنا Blomberg’s K كمقياس لإشارة النشوء والتطور. لدمج عدم اليقين في علم الوراثة ، استخدمنا 250 شجرة نسج على أساس المرجع. 95 والإحصاءات الناتجة المجمعة ، باستخدام قاعدة Rubin الموصوفة في المرجع. 96 بافتراض ص القيم من اختبارات التوزيع العشوائي قابلة للمقارنة مع تلك الموجودة في ر التوزيعات (97).

تقييم انحراف التوزيعات الوفرة.

بالإضافة إلى جمع توزيعات الوفرة الخاصة بالأنواع وحساب التقدير المتوسط ​​الإجمالي (على المقياس الأصلي) لكل عائلة وترتيب وعالم بيوجغرافي ونقابة تغذية ، قمنا أيضًا بحساب توزيع الوفرة لكل فئة من هذه الفئات - مع الإضافة من الجنس - عن طريق جمع التقديرات المتوسطة الخاصة بالأنواع لكل فئة. أظهر كلا النهجين تشابهًا قويًا (الملحق SI، تين. S2 و S3). استخدمنا دالة الانحراف من الحزمة e1071 (98) لحساب الانحراف لتوزيع الوفرة المحدد. لتقييم قوة اكتشافنا أن توزيعات الأنواع والجنس والعائلة والنظام كانت منحرفة ، استخدمنا نهج إعادة التشكيل. أولاً ، أخذنا عينات عشوائية من الكميات (من 0.1 إلى 0.99) وأخذنا تقدير الوفرة عند هذا المقدار لكل نوع (على عكس التقدير المتوسط ​​الذي يتم تقديمه في النص الرئيسي) ثم حسبنا انحراف SAD أيضًا. كالجنس ، والعائلة ، وتوزيعات الوفرة (محسوبة بجمع تقديرات متوسط ​​الوفرة الخاصة بالأنواع) لكل عينة عشوائية. لقد أجرينا هذا 1000 مرة لاشتقاق توزيع مقاييس الانحراف ، مما يدل على قوة اكتشافنا أن توزيعات الوفرة - عبر المستويات التصنيفية - تركت منحرفة (الملحق SI، الشكل S2). بالإضافة إلى ذلك ، قمنا بتنفيذ نهج إقلاع التمهيد لمؤشرات CIs الخاصة بمقاييس الانحراف ، مما يؤكد منهجنا في إعادة التشكيل (الملحق SI، الشكل S3).


مناقشة

قد يكون ظهور الأمراض التي ينقلها القراد بسبب التباين في عدد من العوامل ، مثل وفرة القراد ، وانتشار مسببات الأمراض ، ومستوى الإمراض ، وكذلك مستوى التعرض للقراد من خلال استخدام الأراضي للماشية أو سبل العيش المرتبطة بالغابات أو الأنشطة الترفيهية في البشر. لقد قمنا بمقارنة منطقتين تجاه نطاق التوزيع الشمالي لـ أنا ricinus في أوروبا تختلف إلى حد كبير في عدد حالات داء لايم في البشر ، و anaplasmosis في الأغنام و anaplasmosis و babesiosis في الماشية. أكدنا أن حدوث جميع الأمراض ، وليس فقط عدد الحالات ، كان أقل في المنطقة الشرقية مقارنة بالمنطقة الغربية من النرويج. كان الاكتشاف الأكثر بروزًا هو الانتشار المنخفض جدًا لـ A. البلعمة في البحث عن الحوريات في المنطقة الشرقية ، من المحتمل أن تكون على الأقل جزءًا من تفسير انخفاض معدل الإصابة بمرض الأنابلازما في المنطقة.

دور أنماط توزيع الممرض

تشترك الأمراض المنقولة بالنواقل في سمة مشتركة تتمثل في الاعتماد على وجود الناقل. ومع ذلك ، تختلف مسببات الأمراض المختلفة إلى حد كبير في بيولوجيتها ومدى اعتمادها على مضيف واحد أو العديد من مضيفات الإرسال مع أو بدون توزيع جغرافي واسع. لذلك ، قد يكون توزيع الأمراض التي تنقلها القراد أكثر محدودية من توزيع الناقل. على سبيل المثال ، التوزيع المكاني لفيروس التهاب الدماغ المنقول بالقراد (TBEV) في أوروبا محدود للغاية ، مما يعكس على الأرجح الحاجة إلى ظروف محددة لدورة انتقال التغذية المشتركة. يتطلب انتقال مرض TBEV التغذية المشتركة لما لا يقل عن 10 يرقات وحورية واحدة مصابة على نفس العائل للحصول على دورة وبائية مستمرة [35] ، وهذا مرتبط بظروف درجة حرارة محددة تمامًا [36]. في المقابل ، يمكن توقع وجود داء لايم جيدًا بناءً على وجود الناقل. ليس هناك شك في أن ارتفاع درجة حرارة المناخ يؤثر بشكل مباشر على تاريخ حياة أنا ricinus هو عامل رئيسي يؤثر على الظهور العام لمرض لايم في أوروبا [37،38،39]. تم الإبلاغ عن زيادة حدوث داء لايم في الأجزاء الشمالية من أوروبا ، في كل من النرويج [20] وفنلندا [19]. إذا كان هناك أنا ricinus في منطقة ما ، العامل الممرض B. burgdorferi (م.) عادة ما يكون التسبب في داء لايم موجودًا ، حيث تنتشر مضيفات الإرسال [40]. تمشيا مع هذا ، فإن انتشار B. burgdorferi (م.) في البحث عن الحوريات كانت متشابهة في المنطقتين (11.3٪ في الغرب و 11.4٪ في شرق النرويج).

نمط وفرة البحث عن علامات التجزئة

تعتمد مخاطر المرض على كل من وفرة البحث عن القراد ومستويات انتشار العوامل الممرضة ، والتي تُقاس غالبًا بعدد الحوريات المصابة [13]. من الصعب تحديد وفرة القراد باستخدام طريقة الإبلاغ لأن هذه البيانات تعكس أيضًا أنماط نشاط القراد ، والتي تتأثر بمزيج من الفترة الضوئية والطقس السائد [41 ، 42]. وبالتالي ، يختلف نشاط القراد باختلاف المواسم والسنوات والمناطق. وجدنا وفرة إجمالية أعلى من الحوريات البحثية في الغرب (5.78/20 م 2) ، مقارنة بالشرق (1.36 / 20 م 2) ، والتي ستكون لانتشار مماثل ، كما في B. burgdorferi (م.) ، تسفر عن مخاطر مرضية أعلى في غرب النرويج. قد تساهم هذه الوفرة العالية من قراد البحث في الغرب في ارتفاع معدل حدوث داء لايم بأكثر من 8.3 أضعاف في الغرب (12.4 لكل 100.000) مقارنة بشرق النرويج (1.49 لكل 100.000). كانت السلاسل الزمنية للبيانات الميدانية لدينا أقصر من أن تربط خطر المرض بحدوثه على مدى سنوات ، واعتمدنا على التناقضات المكانية للاستدلال. كان هناك تباين سنوي ملحوظ في وفرة البحث عن القراد في كلا المنطقتين ، لذلك قد يساهم هذا بالتأكيد في تفسير التباين السنوي في حدوث المرض.

وجدنا ما يقرب من ضعف عدد البالغين مقارنة بالحوريات في الشرق مقارنة بالغرب (الجدول 2). على الرغم من أننا لا نستطيع تفسير هذا النمط بمعرفتنا الحالية ، إلا أنه قد يشير إلى أن دورات الحياة والوفيات تختلف بين المناطق. الساحل الغربي للنرويج أكثر دفئًا ورطوبة من المنطقة الشرقية ، التي تتمتع بمناخ داخلي أكثر. كانت درجة الحرارة وليس الرطوبة تحد من نشاط البحث عن القراد على طول الساحل الغربي [42] ، بينما لم تكن هناك دراسة متاحة عن الموسم بأكمله في منطقة الدراسة الشرقية. كان أحد القيود على دراستنا هو عدم وجود بيانات حول التباين الموسمي الكامل في نشاط البحث ، كما اختلفت فترات أخذ العينات أيضًا ، حيث كانت مايو في الغرب ويونيو بشكل رئيسي في الشرق. علاوة على ذلك ، من الممكن أيضًا أن يكون توزيع جينات معينة من B. burgdorferi (م.) تلعب دورًا ، لأنها قد تسبب أعراضًا سريرية مختلفة [43]. أخيرًا ، لا يمكننا تجاهل دور الاختلافات في تعرض الإنسان للقراد بين المناطق [44]. ارتبط حدوث التهاب الدماغ الذي ينقله القراد في أوروبا الشرقية بالنشاط في الغابات ، والذي كان مدفوعًا مرة أخرى بالعوامل الاجتماعية والاقتصادية [45]. كان هناك انخفاض في حدوث داء لايم مع المزيد من المستوطنات البشرية داخل البلدية في دراستنا. من الواضح أن الدراسات الأكثر تفصيلاً حول كيفية تعرض البشر والماشية للقراد في شرق النرويج مقارنة بغرب النرويج ستكون مثمرة.

انتشار متغير مكانيا من A. البلعمة

تعتبر الأنابلازما مشكلة رئيسية في العديد من مناطق أوروبا ، مثل A. البلعمة يعتبر أيضًا أحد مسببات الأمراض المنتشرة على نطاق واسع [6]. على طول الساحل الغربي للنرويج ، يعتبر داء الأنابلازما في الأغنام مشكلة رئيسية [46]. إصابة A. البلعمة يسبب النفوق ويقلل من نمو الجسم في الحملان [47]. غالبًا ما يرتبط التعرض للقراد بحقول الرعي في أوائل الربيع [48] ، قبل إرسال الأغنام للرعي الصيفي على ارتفاعات أعلى مع وفرة أقل من القراد [42]. غالبًا ما تكون هناك أعراض سريرية غامضة مع الأنابلازما وقد لا يتم الإبلاغ عن المرض. مع ذلك ، كان معدل حدوث الأنابلازما في الأغنام مرتفعًا في المنطقة الغربية ، مع حوالي 10 حالات لكل 10000 رأس من الأغنام ، بينما لم تكن هناك حالة مسجلة في المنطقة الشرقية خلال فترة الدراسة (2006-2015 ، الجدول 1 ، الشكل 1). على عكس التوزيع المتساوي للعوامل الممرضة B. burgdorferi (م.) يسبب مرض لايم ، انتشار A. البلعمة كانت أعلى بشكل ملحوظ في الغرب ، مقارنة بشرق النرويج.

في حين أن مضيفي الإرسال B. burgdorferi (م.) معروف [40 ، 49] ، ولا يزال هذا موضع نقاش A. البلعمة [17 ، 50]. غالبًا ما يُستدل على الغزلان الأحمر باعتباره مضيف الإرسال الرئيسي لـ A. البلعمة في النرويج [51] ، ويرتبط توزيع الأيل الأحمر أساسًا بالساحل الغربي للنرويج [52] (ملف إضافي 1: الشكل S2). انتشار A. البلعمة على طول الساحل الغربي كان ارتفاع بنسبة 75٪ في الغزلان الحمراء [53] ، وانتشار A. البلعمة في القراد أعلى في المناطق ذات الوفرة العالية من الغزلان في النرويج [54 ، 55]. ومع ذلك ، تم العثور أيضًا على مستويات عالية من الانتشار (76٪) في اليحمور في فرنسا [56] ، وكلا من اليحمور والموظ مضيفان وفيران في الأجزاء الشرقية من النرويج (ملف إضافي 1: الشكل S2). تمشيا مع هذا ، فإن معظم اليحمور التي شملها الاستطلاع كان لديها A. البلعمة العدوى في المنطقة الشرقية (A. Mysterud et al. ، unpubl. data). لذلك من المدهش أن نرى هذا الانتشار المنخفض في الحوريات. نفترض أن اختيار مضيف اليرقات قد يلعب دورًا في مستويات انتشار العوامل الممرضة في الحوريات. تتواجد يرقات القراد بكثرة على الغزلان الحمراء على الساحل الغربي [57] ، بينما لم نعثر على يرقات على اليحمور في المنطقة الشرقية (A. Mysterud et al.، unpubl. data). كانت العينات المأخوذة من غزال اليحمور من أوائل الربيع ، لذلك من غير المؤكد ما إذا كان هذا يعكس البداية المتأخرة للبحث عن اليرقات أو الاختلافات في اختيار العائل. لذلك يلزم إجراء مزيد من الدراسات لفهم ما إذا كان هذا يمكن أن يوفر ، على الأقل جزءًا من ، تفسيرًا محتملاً للنسبة الأقل من A. البلعمة في الحوريات وانخفاض معدل حدوث الأنابلازما الناتج عن ذلك في شرق النرويج مقارنة بغرب النرويج. إذا كانت اليرقات تتغذى بشكل رئيسي على الفقاريات الأخرى مع انخفاض / لا A. البلعمة العدوى ، سيكون هناك عدد قليل من الحوريات المصابة ، بافتراض أن التغذية المشتركة ليست طريقًا رئيسيًا للانتقال [36]. ومع ذلك ، إذا كانت الحوريات تتغذى على اليحمور ، فإن القراد البالغ قد يكون أكثر انتشارًا A. البلعمة، وإلى حد ما كان هذا هو النمط الذي وجدناه (الجدول 1).

غالبًا ما تتلقى الماشية عددًا من لدغات القراد أكثر من الإنسان ، وحتى الانتشار المنخفض قد يشكل خطرًا كبيرًا للإصابة بالعدوى. ل A. البلعمة، السلالات تختلف في إمراضها للماشية [58]. لقد تم اقتراح أربع سلالات رئيسية متداولة من A. البلعمة في أوروبا مع خزانات في: (1) الغزلان الحمراء والماشية (2) رو أيل (3) القوارض و (4) الطيور [17 ، 50].نظرًا لأن الغزلان الحمراء تشترك في نفس السلالة مثل الماشية ، وبما أن الغزلان الحمراء غائبة إلى حد كبير عن منطقة الدراسة الشرقية (ملف إضافي 1: الشكل S2) ، فقد يوفر هذا شرحًا إضافيًا لغياب الأنابلازما في هذه المنطقة. ومع ذلك ، فإن كلا من عدد A. البلعمة سلالات وكذلك إمراضية سلالات الماشية في النرويج لا تزال تعتبر غير مؤكدة [51].


الافتراضات والقيود

يعتمد استخدام الارتباط والانحدار على بعض الافتراضات الأساسية. من المفترض أن تكون الملاحظات مستقلة. بالنسبة للارتباط ، يجب أن يكون كلا المتغيرين متغيرات عشوائية ، ولكن بالنسبة للانحدار ، يجب أن يكون متغير الاستجابة y عشوائيًا. عند إجراء اختبارات الفرضيات أو حساب فترات الثقة لمعلمات الانحدار ، يجب أن يكون لمتغير الاستجابة توزيع طبيعي ويجب أن تكون متغيرات y هي نفسها لكل قيمة من قيم متغير التوقع. هناك حاجة إلى نفس الافتراضات في اختبار الفرضية الصفرية بأن الارتباط هو 0 ، ولكن من أجل تفسير فترات الثقة لمعامل الارتباط ، يجب توزيع كلا المتغيرين بشكل طبيعي. يفترض كل من الارتباط والانحدار أن العلاقة بين المتغيرين خطية.

يوفر الرسم البياني المبعثر للبيانات فحصًا أوليًا لافتراضات الانحدار. يمكن تقييم الافتراضات بمزيد من التفصيل من خلال النظر في قطع الأراضي المتبقية [4،7]. بشكل عام ، يتم رسم القيم المتبقية مقابل القيم المجهزة. إذا كانت العلاقة خطية وثابت التباين ، فيجب أن تكون البقايا مبعثرة بالتساوي حول 0 على طول نطاق القيم المجهزة (الشكل & # x200 ب (الشكل 11 11).

(أ) يشير الرسم البياني المبعثر لـ y مقابل x إلى أن العلاقة غير خطية. (ب) مؤامرة القيم المتبقية مقابل القيم المجهزة في اللوحة أ ، يظهر انحناء العلاقة بشكل أكثر وضوحًا. (ج) يوضح الرسم البياني المبعثر لـ y مقابل x أن التباين في y يزداد مع x. (د) يظهر مؤامرة المخلفات مقابل القيم المجهزة للوحة c التباين المتزايد في y مع x بشكل أكثر وضوحًا.

بالإضافة إلى ذلك ، يمكن إنتاج قطعة أرض عادية من المخلفات. هذه قطعة من القيم المتبقية مقابل القيم التي من المتوقع أن تأخذها إذا جاءت من التوزيع الطبيعي القياسي (الدرجات العادية). إذا تم توزيع المخلفات بشكل طبيعي ، فستظهر هذه المؤامرة خطًا مستقيمًا. (التوزيع الطبيعي القياسي هو توزيع عادي بمتوسط ​​= 0 وانحراف معياري = 1.) تتوفر المخططات العادية عادة في الحزم الإحصائية.

توضح الأشكال # x200B الشكلان 12 12 و & # x200B و 13 13 المؤامرات المتبقية لبيانات A & # x00026E. تشير مؤامرة القيم المجهزة مقابل القيم المتبقية إلى استيفاء افتراضات الخطية والتباين المستمر. تشير الحبكة العادية إلى أن توزيع المخلفات أمر طبيعي.

مؤامرة المخلفات مقابل القيم المجهزة لبيانات وحدة الطوارئ والحادث.

مؤامرة عادية لبقايا الحادث وبيانات وحدة الطوارئ.

عند استخدام معادلة الانحدار للتنبؤ ، قد لا تكون الأخطاء في التنبؤ عشوائية فحسب ، بل قد تكون أيضًا بسبب أوجه القصور في النموذج. على وجه الخصوص ، الاستقراء خارج نطاق البيانات محفوف بالمخاطر للغاية.

والظاهرة التي يجب الانتباه إليها والتي قد تنشأ مع تكرار القياسات على الأفراد هي الانحدار إلى المتوسط. على سبيل المثال ، إذا تم أخذ قياسات متكررة لضغط الدم ، فإن المرضى الذين لديهم قيم أعلى من المتوسط ​​في قراءتهم الأولى سيميلون إلى الحصول على قراءات أقل في القياس الثاني. لذلك ، فإن الفرق بين القياسين الثاني والأول يميل إلى أن يكون سالبًا. والعكس صحيح بالنسبة للمرضى الذين لديهم قراءات أقل من المتوسط ​​في القياس الأول ، مما يؤدي إلى ارتفاع واضح في ضغط الدم. قد يؤدي هذا إلى تفسيرات مضللة ، على سبيل المثال أنه قد يكون هناك ارتباط سلبي واضح بين التغيير في ضغط الدم وضغط الدم الأولي.


شاهد الفيديو: طريقة شفط البويضات (شهر فبراير 2023).