مقایسه ضریب همبستگی خطی پیرسون با چترجی (Chatterjee)
در کلیپ زیر، ضریب همبستگی خطی پیرسون با یک ضریب همبستگی غیر خطی، موسوم به Chatterjee، مقایسه شده است. مشاهده میشود که همبستگی چَتِرجی، در تشخیص و بیان ارتباط متغیرهای تصادفی، به مراتب بهتر عمل میکند.
لینک مقاله اصلی مربوط به این ضریب همبستگی، از این مسیر [+] در دسترس است. ضریب همبستگی Chatterjee بین دو متغیر تصادفی X و Y، در حالتی که بین نمونههای X عدد تکراری نداشته باشیم، با فرمول اول و اگر عدد تکراری باشد، با فرمول دوم محاسبهپذیر است. در حالت حدی نیز، مقدار این ضریب همبستگی غیر خطی، با فرمول انتگرالی سوم قابل بیان است.
روش کلی محاسبه هم این طور است که ابتدا، زوجهای داده در دسترس را بر حسب متغیر تصادفی اول (X) مرتب میکنیم. پس از آن، اندیسهای X و Y برای نمونهها، بر حسب این ترتیب، بازتعریف میشوند. در نهایت، بر اساس رتبه هر کدام از مقایر Y در فهرست Yها، اعداد رتبه r تعریف میشوند.
در متن مقاله، مقدار ضریب همبستگی چترجی برای نمونههایی از دادههای فرضی ارائه شدهاند. مقدار این ضریب همبستگی همواره عددی بین صفر و یک است. اگر دو متغیر تصادفی کاملا مستقل باشند، مقدار ضریب صفر و اگر تابعی (هر چند غیر خطی) دو متغیر را به هم مربوط کند، مقدار ضریب یک خواهد شد.
نکته مهم دیگر هم این است که مقدار ضریب همبستگی با عوض شدن جای دو متغیر تصادفی X و Y، ثابت نمیماند. یعنی این ضریب، مثل اغلب ضرایب همبستگی، متقارن نیست.