සාමාන්යකරණය කරන ලද රේඛීය ආකෘති (GLMs) යනු අඛණ්ඩ නොවන ප්රතිචාර විචල්යයන් සහ සාමාන්ය නොවන දෝෂ බෙදාහැරීම් හැසිරවීමට සම්භාව්ය රේඛීය ප්රතිගාමී ආකෘතිය දිගු කරන සංඛ්යාලේඛන සහ ගණිතයේ ප්රබල රාමුවකි. කෙසේ වෙතත්, ඕනෑම සංඛ්යානමය ආකෘතියක් මෙන්, GLMs ඔවුන්ගේ උපකල්පන සහ කාර්යසාධනය සඳහා දැඩි ලෙස ඇගයීමට ලක් කළ යුතුය. ආකෘතියේ ප්රමාණවත් බව සහ විශ්වසනීයත්වය තක්සේරු කිරීම සඳහා අත්යවශ්ය මෙවලම් සහ ශිල්පීය ක්රම සපයන GLM රෝග විනිශ්චය ක්රියාත්මක වන්නේ මෙහිදීය.
GLM Diagnostics හි ප්රධාන සංකල්ප
නිශ්චිත රෝග විනිශ්චය ක්රම සොයා බැලීමට පෙර, GLM රෝග විනිශ්චයට යටින් පවතින ප්රධාන සංකල්ප තේරුම් ගැනීම ඉතා වැදගත් වේ:
- අවශේෂ විශ්ලේෂණය: GLM වල අවශේෂ යනු නිරීක්ෂිත සහ පුරෝකථනය කළ අගයන් අතර වෙනස්කම් වේ. අවශේෂ විශ්ලේෂණය කිරීම ආකෘතියේ වලංගු භාවය තක්සේරු කිරීම සඳහා තීරනාත්මක වන රටා, පිටස්තර සහ විෂමතාවය හඳුනා ගැනීමට උපකාරී වේ.
- බලපෑම් ක්රියාමාර්ග: මෙම පියවර මඟින් ආදර්ශ ඇස්තමේන්තුව මත එක් එක් දත්ත ලක්ෂ්යයේ බලපෑම ප්රමාණ කරයි. ආකෘතියේ ස්ථායීතාවය අවබෝධ කර ගැනීම සඳහා බලගතු නිරීක්ෂණ හඳුනා ගැනීම මූලික වේ.
- යහපත්කම-සුදුසුකම: අපගමනය, AIC, සහ BIC වැනි පියවර ඇතුළුව දත්ත වලට ආකෘතියේ සමස්ත ගැළපීම ඇගයීම, ආකෘතියේ ක්රියාකාරීත්වය පිළිබඳ පරිපූර්ණ තක්සේරුවක් සපයයි.
GLM රෝග විනිශ්චය සඳහා ක්රම
GLM එකක ප්රමාණවත් බව නිර්ණය කිරීම සඳහා විවිධ ශිල්පීය ක්රම භාවිතා කරනු ලැබේ. බහුලව භාවිතා වන සමහර ක්රම ඇතුළත් වේ:
- අවශේෂ විශ්ලේෂණය: පුරෝකථනය කරන ලද අගයන්, කෝවේරියට් සහ කාලය (අදාළ නම්) වලට එරෙහිව අවශේෂයන් සැලසුම් කිරීමෙන් රටා සහ පිටස්තරයන් හෙළි කළ හැකිය.
- ප්රමිතිගත අවශේෂ: අවශේෂයන් මධ්යන්ය 0 සහ 1 හි විචල්යයක් බවට පරිවර්තනය කිරීමෙන් විවිධ මාදිලි සහ දත්ත කට්ටල හරහා ඒවායේ විශාලත්වයන් සංසන්දනය කිරීමට හැකියාව ලැබේ.
- කුක්ගේ දුර: මෙම මිනුම ආදර්ශයේ සංගුණක මත පුද්ගල නිරීක්ෂණවල බලපෑම ප්රමාණනය කරයි, බලගතු දත්ත ලක්ෂ්ය හඳුනා ගැනීමට උපකාරී වේ.
- Hosmer-Lemeshow පරීක්ෂණය: ද්විමය ප්රතිචාර විචල්යයන් සඳහා, මෙම පරීක්ෂණය විවිධ කණ්ඩායම්වල නිරීක්ෂණය කරන ලද සහ අපේක්ෂිත සංඛ්යාත සංසන්දනය කිරීමෙන් ගැළපුම හොඳ බව තක්සේරු කරයි.
- QQ Plots: Quantile-Quantile බිම් කොටස් ප්රතිචාර විචල්යයේ බෙදා හැරීමේ උපකල්පන හඳුනා ගැනීමට සහ උපකල්පිත ව්යාප්තියෙන් බැහැරවීම් හඳුනා ගැනීමට ප්රයෝජනවත් වේ.
උදාහරණ යෙදුම: ද්විමය ප්රතිඵල සඳහා ආකෘතිය
නිශ්චිත වෛද්ය මැදිහත්වීමකින් පසු රෝගියෙකුගේ පැවැත්මේ සම්භාවිතාව වැනි ද්විමය ප්රතිඵලයක සම්භාවිතාව ආදර්ශනය කිරීමට අප උනන්දු යැයි සිතමු. සාමාන්ය ප්රවේශයක් වන්නේ GLM රාමුව තුළ ලොජිස්ටික් ප්රතිගාමී ආකෘතියක් භාවිතා කිරීමයි. ආකෘතියේ වලංගුභාවය සහතික කිරීම සඳහා, අපි විවිධ රෝග විනිශ්චය පරීක්ෂාවන් සිදු කරන්නෙමු.
පළමුව, අපට පුරෝකථනය කළ සම්භාවිතාවන්ට එරෙහිව ප්රමිතිගත අවශේෂයන් සැලසුම් කළ හැකිය. කුමන්ත්රණය දෘශ්යමය වශයෙන් පරීක්ෂා කිරීමෙන්, අපට ආකෘතියේ උපකල්පන හෝ බලගතු දත්ත ලක්ෂ්ය සමඟ ගැටලු දැක්විය හැකි ඕනෑම රටා හෝ පිටස්තර හඳුනා ගත හැකිය.
අතිරේකව, ආකෘතියේ හොඳ යෝග්යතාවය පරීක්ෂා කිරීම සඳහා අපට Hosmer-Lemeshow සංඛ්යාලේඛනය ගණනය කළ හැකිය. පුරෝකථනය කරන ලද සම්භාවිතාව දශමවලට කාණ්ඩ කිරීම සහ එක් එක් කාණ්ඩයේ නිරීක්ෂිත සහ අපේක්ෂිත සංඛ්යාත සංසන්දනය කිරීම මෙයට ඇතුළත් වේ.
තවද, QQ බිම් කොටස් ප්රමිතිගත අවශේෂ බෙදා හැරීම උපකල්පිත සැපයුම් ව්යාප්තිය සමඟ සමපාත වන්නේද යන්න පරීක්ෂා කිරීමට භාවිතා කළ හැක. QQ කුමන්ත්රණයේ අපේක්ෂිත රටාවෙන් බැහැරවීම් ආකෘතියේ උපකල්පනවල ප්රමාණවත් නොවන බව යෝජනා කළ හැක.
නිගමනය
සාමාන්යකරණය කරන ලද රේඛීය ආකෘතිවල ශක්තිමත් බව සහ විශ්වසනීයත්වය සහතික කිරීම සඳහා GLM රෝග විනිශ්චය අත්යවශ්ය වේ. ප්රධාන සංකල්ප අවබෝධ කර ගැනීමෙන් සහ විවිධ රෝග විනිශ්චය ක්රම භාවිතා කිරීමෙන්, සංඛ්යාලේඛනඥයින්ට සහ පර්යේෂකයන්ට තම ආකෘතිවල ගුණාත්මක බව විශ්වාසයෙන් තක්සේරු කර දැනුවත් තීරණ ගත හැකිය. ද්විමය ප්රතිඵල සමඟ කටයුතු කළත්, දත්ත ගණනය කළත්, හෝ වෙනත් අඛණ්ඩ නොවන ප්රතිචාර විචල්යයන් සමඟ කටයුතු කළත්, GLM රෝග විනිශ්චය කිරීමේ මූලධර්ම නිවැරදි සහ අර්ථවත් ප්රතිඵල නිපදවීම සඳහා අත්යවශ්ය වේ.