۵ دی ۱۴۰۰

مقایسه ضریب همبستگی خطی پیرسون با چترجی (Chatterjee)

مقایسه ضریب همبستگی خطی پیرسون با چترجی (Chatterjee)

در کلیپ زیر، ضریب همبستگی خطی پیرسون با یک ضریب همبستگی غیر خطی، موسوم به Chatterjee، مقایسه شده است. مشاهده می‌شود که همبستگی چَتِرجی، در تشخیص و بیان ارتباط متغیرهای تصادفی، به مراتب بهتر عمل می‌کند.

لینک مقاله اصلی مربوط به این ضریب همبستگی، از این مسیر [+] در دسترس است. ضریب همبستگی Chatterjee بین دو متغیر تصادفی X و Y، در حالتی که بین نمونه‌های X عدد تکراری نداشته باشیم، با فرمول اول و اگر عدد تکراری باشد، با فرمول دوم محاسبه‌پذیر است. در حالت حدی نیز، مقدار این ضریب همبستگی غیر خطی، با فرمول انتگرالی سوم قابل بیان است.

روش کلی محاسبه هم این طور است که ابتدا، زوج‌های داده در دسترس را بر حسب متغیر تصادفی اول (X) مرتب می‌کنیم. پس از آن، اندیس‌های X و Y برای نمونه‌ها، بر حسب این ترتیب، بازتعریف می‌شوند. در نهایت، بر اساس رتبه هر کدام از مقایر Y در فهرست Yها، اعداد رتبه r تعریف می‌شوند.

در متن مقاله، مقدار ضریب همبستگی چترجی برای نمونه‌هایی از داده‌های فرضی ارائه شده‌اند. مقدار این ضریب همبستگی همواره عددی بین صفر و یک است. اگر دو متغیر تصادفی کاملا مستقل باشند، مقدار ضریب صفر و اگر تابعی (هر چند غیر خطی) دو متغیر را به هم مربوط کند، مقدار ضریب یک خواهد شد.

نکته مهم دیگر هم این است که مقدار ضریب همبستگی با عوض شدن جای دو متغیر تصادفی X و Y، ثابت نمی‌ماند. یعنی این ضریب، مثل اغلب ضرایب همبستگی، متقارن نیست.

اشتراک‌گذاری این مطلب:
  • facebook
  • twitter
  • gplus

با من در شبکه‌های اجتماعی همراه باشید:

دیدگاه خود را بیان کنید

دیدگاه‌ها