මූලධර්ම සංරචක විශ්ලේෂණය (pca)

මූලධර්ම සංරචක විශ්ලේෂණය (pca)

ප්‍රධාන සංරචක විශ්ලේෂණය (PCA) යනු යන්ත්‍ර ඉගෙනීම, ගණිතය සහ සංඛ්‍යාලේඛනවල රටා හඳුනා ගැනීමට, මානයන් අඩු කිරීමට සහ දත්ත දෘශ්‍යමාන කිරීමට භාවිතා කරන ප්‍රබල සංඛ්‍යාන තාක්ෂණයකි. මෙම මාතෘකා පොකුර PCA හි මූලික මූලධර්ම, එහි ගණිතමය යටිපෙළ සහ සැබෑ-ලෝක යෙදුම් වෙත ගවේෂණය කරනු ඇත.

මූලික සංරචක විශ්ලේෂණය අවබෝධ කර ගැනීම

PCA යනු කුමක්ද?

PCA යනු සහසම්බන්ධ විචල්‍ය සමූහයක් ප්‍රධාන සංරචක ලෙස හඳුන්වන සහසම්බන්ධ නොවන විචල්‍ය සමූහයක් බවට පරිවර්තනය කරන බහුවිචල්‍ය සංඛ්‍යාන තාක්‍ෂණයකි. මෙම සංරචක දත්තවල උපරිම විචලනය ග්‍රහණය කරයි, මානය අඩු කිරීමට සහ සංකීර්ණ දත්ත කට්ටලවල අර්ථ නිරූපණය සරල කිරීමට ඉඩ සලසයි.

PCA වැඩ කරන්නේ කෙසේද?

PCA ක්‍රියා කරන්නේ ආදාන දත්තවල covariance matrix හි eigenvalues ​​සහ eigenvectors සොයා ගැනීමෙනි. eigenvalues ​​මගින් එක් එක් ප්‍රධාන සංරචක මගින් ග්‍රහණය කර ගන්නා විචල්‍ය ප්‍රමාණය නියෝජනය කරන අතර, eigenvectors දත්තවල උපරිම විචල්‍යයේ දිශාව නිර්වචනය කරයි.

PCA හි ගණිතමය පදනම්

Covariance Matrix සහ Eigen Decomposition

PCA හි, covariance matrix ප්‍රධාන සංරචක නිර්ණය කිරීමේදී තීරණාත්මක කාර්යභාරයක් ඉටු කරයි. covariance matrix හි eigen වියෝජනය මගින් ප්‍රධාන සංරචක හඳුනාගැනීමේදී අත්‍යවශ්‍ය වන eigenvalues ​​සහ eigenvectors ලැබේ.

ඒකීය අගය වියෝජනය (SVD)

SVD යනු PCA හා සමීපව සම්බන්ධ තවත් ගණිතමය තාක්ෂණයකි. එය ප්‍රධාන සංරචක ගණනය කිරීම සඳහා විකල්ප ක්‍රමයක් සපයන අතර මානයන් අඩු කිරීම සහ විශේෂාංග නිස්සාරණය සඳහා යන්ත්‍ර ඉගෙනුම් ඇල්ගොරිතමවල බහුලව භාවිතා වේ.

PCA හි යෙදුම්

Dimensionality අඩු කිරීම

PCA හි මූලික යෙදුම්වලින් එකක් වන්නේ මානය අඩු කිරීමයි. වඩාත්ම විචලනය ග්‍රහණය කරන ප්‍රධාන සංරචකවල උප කුලකයක් පමණක් තේරීමෙන්, අධිමාන දත්ත කට්ටල තීරණාත්මක තොරතුරු අහිමි නොවී සරල කළ හැක.

රූප සම්පීඩනය

PCA රූප සම්පීඩන ඇල්ගොරිතමවල බහුලව භාවිතා කර ඇති අතර, අතිරික්ත තොරතුරු ඉවතලන අතරම රූපයක අත්‍යවශ්‍ය ලක්ෂණ නියෝජනය කිරීමට ප්‍රධාන සංරචක භාවිතා කරයි. මෙමගින් ඩිජිටල් රූප කාර්යක්ෂමව ගබඩා කිරීමට සහ සම්ප්‍රේෂණය කිරීමට ඉඩ සලසයි.

රටා හඳුනාගැනීම

PCA මුහුණ හඳුනාගැනීම සහ කථන විශ්ලේෂණය වැනි විවිධ රටා හඳුනාගැනීමේ කාර්යයන්හි යෙදේ. PCA හරහා ප්‍රධාන අංග උපුටා ගැනීමෙන්, හඳුනාගැනීමේ ඇල්ගොරිතමවලට දත්තවල රටා ඵලදායි ලෙස හඳුනාගෙන වර්ගීකරණය කළ හැක.

සැබෑ ලෝක උදාහරණ

කොටස් වෙළෙඳපොළ විශ්ලේෂණය

කොටස් වෙලඳපොල චලනයන් මෙහෙයවන මූලික සාධක හඳුනා ගැනීමට මූල්‍ය විශ්ලේෂකයින් PCA භාවිතා කරයි. කොටස් ප්‍රතිලාභවල සහවිචල්‍ය ව්‍යුහය විශ්ලේෂණය කිරීමෙන්, PCA හට වෙළෙඳපොළ තුළ අවදානම් සහ ප්‍රතිලාභ පිළිබඳ ප්‍රධාන මූලාශ්‍ර හෙළිදරව් කළ හැකි අතර, කළඹ ප්‍රශස්තකරණයට සහ අවදානම් කළමනාකරණයට සහාය වේ.

ජෛව වෛද්‍ය දත්ත විශ්ලේෂණය

ජෛව වෛද්‍ය පර්යේෂණ වලදී, ජාන ප්‍රකාශන පැතිකඩ සහ සායනික මිනුම් වලින් ඉහළ-මාන දත්ත විශ්ලේෂණය කිරීමට PCA යොදනු ලැබේ. දත්තවල ප්‍රමුඛ රටා හඳුනා ගැනීමෙන්, රෝග යාන්ත්‍රණයන් අවබෝධ කර ගැනීමට සහ රෝගියාගේ ප්‍රතිඵල පුරෝකථනය කිරීමට PCA හට සහාය විය හැක.

නිගමනය

PCA සමඟින් අගුලු හැරීම

එහි ගණිතමය පදනම්වල සිට සැබෑ ලෝකයේ යෙදුම් දක්වා, PCA විසින් සංකීර්ණ දත්ත කට්ටල පිළිබඳ වටිනා අවබෝධයක් ලබා දෙන අතර, එය යන්ත්‍ර ඉගෙනීම, ගණිතය සහ සංඛ්‍යාලේඛන සඳහා අත්‍යවශ්‍ය මෙවලමක් බවට පත් කරයි. PCA හි බලය උපයෝගී කර ගැනීමෙන්, පර්යේෂකයන්ට සහ වෘත්තිකයන්ට දත්ත රටා පිළිබඳ ගැඹුරු අවබෝධයක් ලබා ගත හැකි අතර විවිධ වසම් තුළ දැනුවත් තීරණ ගත හැකිය.