Pengecaman pola
From Wikipedia
Pengecaman pola (juga dikenali sebagai pengkelasan atau pengkelasan pola) merupakan bidang dalam mana pembelajaran mesin (machine learning) dan boleh ditakrifkan sebagai "tindakan mengambil data kasar dan bertindak berdasarkan pengkelasan data" [1]. Dengan itu, ia merupakan himpunan kaedah bagi pembelajaran diselia (supervised learning).
Applikasi biasa adalah pengecaman speech recognition, pengkelasan teks dokumen kepada beberapa kategori (contoh. surat-E spam/bukan-spam), pengecaman tulisan (handwriting recognition) poskod secara automatik pada sampul surat, atau sistem pengecaman muka bagi muka manusia. Tiga contoh akhir membentuk sub topik analisa imej bagi pengecaman pola yang berkenaan imej digital sebagai input kepada sistem pengecaman pola.
Jadual isi kandungan |
[Sunting] Teknik pengecaman pola
Pengecaman pola biasanya merupakan langkah perantaraan bagi proses lebih lanjut. Langkah ini biasanya merupakan dapatan data (imej, bunyi, teks, dll.) untuk dikelaskan, preprosesan untuk menghilangkan gangguan atau menormalkan imej dalam satu cara (pemprosesan imej (image processing), teks dll.), pengiraan ciri-ciri, pengkelasan dan akhirnya post-pemprosessan berdasarkan kelas pengecaman dan aras keyakinan.
Pengecaman pola itu sendiri khususnya berkaitan dengan langkah pengkelasan. Dalam kes tertentu, sebagaimana dalam jaringan neural (neural networks) , pemilihan ciri-ciri dan pengambilan juga boleh dilaksanakan secara separuh automatik atau automatik sepenuhnya.
Sementara terdapat banyak kaedah untuk pengkelasan, ia menyelesaikan satu dari tiga masalah methametik berkaitan.
Pertama adalah mencari peta ruang ciri (feature space) (biasanya pelbagai dimensi ruang vektor (vector space)) bagi set label. Ia bersamaan dengan membahagi ruang ciri kepada kawasan, kemudian meletakkan lebel kepada setiap kawasan. Algorithm sedemikian (contoh., the nearest neighbour algorithm) typically do not yield confidence or class probabilities, unless post-processing is applied.
Masalah kedua adalah untuk menganggap masalah sebagai masalah anggaran, dimana matlamat adalah untuk menganggar fungsi bagi bentuk
dimana input vektor ciri adalah , dan fungsi f biasanya diparameter oleh sebahagian parameter
. Dalam pendekatan statistik Bayesian bagi masalah ini, berlainan dengan memilih satu vektor parameter
, hasil dibentuk bagi kesemua thetas yang mungkin, dengan turutan berat bagi ketepatan berdasarkan data latihan D:
Masalah ketiga berkait dengan masalah kedua, tetapi masalahnya adalah bagi menganggar kebangkalian bersyarat (conditional probability) dan kemudian menggunakan aturan Bayes untuk menghasilkan kemungkinan kelas sebagaimana dalam masalah kedua.
Contoh algorithm pengkelasan termasuk:
- Pengkelasan Linear
- diskriminant linear Fisher (Fisher's linear discriminant)
- regression Logistik
- Naive Bayes classifier
- Perceptron
- Nearest_neighbor_(pattern_recognition)|k-nearest neighbor
- Boosting
- Decision tree
- Jaringan Neural
- Jaringan Bayesian
- Mesin sokongan vektor (Support vector machine)
- Model Markov Tersembunyi (Hidden Markov model)
[Sunting] domain Applikasi
- penglihatan komputer (Computer vision)
- analisa imej perubatan (Medical image analysis)
- Optical character recognition
- Pengecam pertuturan (Speech recognition)
- Pengecaman tulisan (Handwriting recognition)
- Biometric indentification
- pengkelasan dokuman
- Internet enjin gelintir search engines
- Credit scoring
[Sunting] Lihat juga
- Pembelajaran mesin
- Statistik
- Kecerdasan buatan (Artificial intelligence)
- Capaian maklumat (Information retrieval)
- Algorithm Viterbi
- Dynamic time warping
[Sunting] Rujukan
- Richard O. Duda, Peter E. Hart, David G. Stork (2001) Pattern classification (2nd edition), Wiley, New York, ISBN 0471056693.
- J. Schuermann: Pattern Classification: A Unified View of Statistical and Neural Approaches, Wiley&Sons, 1996, ISBN 0471135348