Biografi Ciri-ciri Analisis

Teori pengecaman corak. Kaedah berdasarkan andaian tentang kelas fungsi keputusan

Dan tanda-tanda. Tugas sedemikian sering diselesaikan, contohnya, apabila menyeberang atau memandu jalan di lampu isyarat. Pengiktirafan warna lampu isyarat yang menyala dan pengetahuan tentang peraturan lalu lintas membolehkan anda membuat keputusan yang tepat sama ada hendak menyeberang jalan atau tidak pada masa ini.

Sedang berlangsung evolusi biologi banyak haiwan dengan bantuan alat visual dan pendengaran menyelesaikan masalah pengecaman corak cukup bagus. Ciptaan sistem buatan pengecaman corak kekal sebagai teori yang kompleks dan masalah teknikal. Keperluan untuk pengiktirafan sedemikian timbul dalam pelbagai bidang - daripada hal ehwal ketenteraan dan sistem keselamatan kepada pendigitalan semua jenis isyarat analog.

Secara tradisinya, tugas pengecaman imej termasuk dalam skop tugas kecerdasan buatan.

Arah dalam pengecaman corak

Terdapat dua arah utama:

  • Kajian tentang kebolehan pengiktirafan yang dimiliki oleh makhluk hidup, penjelasan dan pemodelan mereka;
  • Pembangunan teori dan kaedah untuk membina peranti yang direka untuk menyelesaikan masalah individu dalam masalah gunaan.

Pernyataan rasmi masalah

Pengecaman corak ialah penugasan data awal kepada kelas tertentu dengan menyerlahkan ciri penting yang mencirikan data ini daripada berat keseluruhan data yang tidak relevan.

Apabila menetapkan masalah pengecaman, mereka cuba menggunakan bahasa matematik, mencuba, tidak seperti teori rangkaian saraf tiruan, di mana asasnya adalah untuk mendapatkan hasil melalui eksperimen, untuk menggantikan eksperimen dengan penaakulan logik dan bukti matematik.

Selalunya, imej monokrom dipertimbangkan dalam masalah pengecaman corak, yang memungkinkan untuk mempertimbangkan imej sebagai fungsi pada satah. Jika kita pertimbangkan set titik di permukaan T, di mana fungsi x(x,y) menyatakan pada setiap titik imej cirinya - kecerahan, ketelusan, ketumpatan optik, maka fungsi sedemikian adalah rekod rasmi imej.

Set semua fungsi yang mungkin x(x,y) di permukaan T- terdapat model set semua imej X. Memperkenalkan konsep persamaan antara imej, anda boleh menetapkan tugas pengecaman. Bentuk khusus tetapan sedemikian sangat bergantung pada peringkat berikutnya dalam pengiktirafan mengikut satu atau pendekatan lain.

Kaedah pengecaman corak

Untuk pengecaman optik imej, anda boleh menggunakan kaedah lelaran jenis objek pada sudut, skala, offset yang berbeza, dsb. Untuk huruf, anda perlu mengulang fon, sifat fon, dsb.

Pendekatan kedua ialah mencari kontur objek dan memeriksa sifatnya (ketersambungan, kehadiran sudut, dll.)

Pendekatan lain ialah menggunakan rangkaian saraf tiruan. Kaedah ini memerlukan sama ada sebilangan besar contoh tugasan pengecaman (dengan jawapan yang betul), atau struktur khas rangkaian saraf yang mengambil kira spesifik tugas ini.

Perceptron sebagai kaedah pengecaman corak

F. Rosenblatt, memperkenalkan konsep model otak, yang tugasnya adalah untuk menunjukkan bagaimana, dalam beberapa sistem fizikal, struktur dan sifat berfungsi yang diketahui, mungkin berlaku fenomena psikologi- menerangkan yang paling mudah eksperimen diskriminasi. Eksperimen ini berkaitan sepenuhnya dengan kaedah pengecaman corak, tetapi berbeza kerana algoritma penyelesaian tidak bersifat deterministik.

Eksperimen yang paling mudah, berdasarkan yang mungkin untuk mendapatkan maklumat yang signifikan secara psikologi tentang sistem tertentu, bermuara pada fakta bahawa model itu dibentangkan dengan dua rangsangan yang berbeza dan diperlukan untuk bertindak balas kepada mereka dengan cara yang berbeza. Tujuan eksperimen sedemikian mungkin adalah untuk mengkaji kemungkinan diskriminasi spontan mereka oleh sistem jika tiada campur tangan daripada penguji, atau, sebaliknya, untuk mengkaji diskriminasi paksa, di mana penguji berusaha untuk mengajar sistem untuk melaksanakan klasifikasi yang diperlukan.

Dalam eksperimen pembelajaran, perceptron biasanya dipersembahkan dengan urutan imej tertentu, yang merangkumi wakil setiap kelas untuk dibezakan. Menurut beberapa peraturan pengubahsuaian memori, pilihan tindak balas yang betul diperkukuh. Kemudian rangsangan kawalan dibentangkan kepada perceptron dan kebarangkalian untuk mendapatkan gerak balas yang betul untuk rangsangan kelas ini ditentukan. Bergantung pada sama ada rangsangan kawalan yang dipilih sepadan atau tidak sepadan dengan salah satu imej yang digunakan dalam urutan latihan, keputusan yang berbeza diperoleh:

  • 1. Jika rangsangan kawalan tidak bertepatan dengan mana-mana rangsangan pembelajaran, maka eksperimen itu dikaitkan bukan sahaja dengan diskriminasi tulen, tetapi juga termasuk elemen generalisasi.
  • 2. Jika rangsangan kawalan merangsang set elemen deria tertentu yang berbeza sama sekali daripada unsur-unsur yang diaktifkan di bawah pengaruh rangsangan yang dibentangkan sebelum ini daripada kelas yang sama, maka eksperimen adalah kajian generalisasi tulen .

Perceptron tidak mempunyai kapasiti untuk generalisasi tulen, tetapi ia berfungsi dengan cukup memuaskan dalam eksperimen diskriminasi, terutamanya jika rangsangan kawalan bertepatan cukup rapat dengan salah satu corak yang perceptron telah mengumpul beberapa pengalaman.

Contoh masalah pengecaman corak

  • Pengecaman huruf.
  • Pengecaman kod bar.
  • Pengiktirafan plat lesen.
  • Pengecaman muka.
  • Pengenalan suara.
  • Pengecaman imej.
  • Pengiktirafan kawasan tempatan kerak bumi mengandungi deposit mineral.

Program pengecaman corak

lihat juga

Nota

Pautan

  • Yuri Lifshits. Kursus "Masalah Moden Informatik Teoretikal" - kuliah mengenai kaedah statistik pengecaman imej, pengecaman muka, pengelasan teks
  • Jurnal Penyelidikan Pengecaman Corak (Jurnal Penyelidikan Pengecaman Corak)

kesusasteraan

  • David A. Forsyth, Jean Pons Visi komputer. Pendekatan Moden = Penglihatan Komputer: Pendekatan Moden. - M.: "Williams", 2004. - S. 928. - ISBN 0-13-085198-1
  • George Stockman, Linda Shapiro Penglihatan komputer = Penglihatan Komputer. - M.: Binom. Makmal Pengetahuan, 2006. - S. 752. - ISBN 5947743841
  • A.L. Gorelik, V.A. Skripkin, Kaedah pengiktirafan, M.: Sekolah siswazah, 1989.
  • Sh.-K. Cheng, Prinsip reka bentuk sistem maklumat visual, M.: Mir, 1994.

Yayasan Wikimedia. 2010 .

- dalam teknologi, arah saintifik dan teknikal yang berkaitan dengan pembangunan kaedah dan pembinaan sistem (termasuk berdasarkan komputer) untuk mewujudkan kepunyaan objek tertentu (objek, proses, fenomena, situasi, isyarat) kepada satu daripada pra ... ... Kamus Ensiklopedia Besar

Salah satu kawasan baru sibernetik. Kandungan teori R. tentang. ialah ekstrapolasi sifat objek (imej) kepunyaan beberapa kelas kepada objek yang hampir dengan mereka dalam erti kata tertentu. Biasanya, apabila mengajar automaton R. tentang. terdapat ... ... Ensiklopedia Geologi

Inggeris pengiktirafan, imej; Jerman Gestalt alterkennung. Cabang sibernetik matematik yang membangunkan prinsip dan kaedah untuk mengelas dan mengenal pasti objek yang diterangkan oleh set ciri terhingga yang mencirikannya. Antinazi. Ensiklopedia ... ... Ensiklopedia Sosiologi

Pengecaman corak- kaedah mengkaji objek kompleks dengan bantuan komputer; terdiri daripada pemilihan ciri dan pembangunan algoritma dan program yang membolehkan komputer mengklasifikasikan objek secara automatik mengikut ciri ini. Sebagai contoh, untuk menentukan yang ... ... Kamus Ekonomi dan Matematik

- (teknikal), arah saintifik dan teknikal yang berkaitan dengan pembangunan kaedah dan pembinaan sistem (termasuk yang berasaskan komputer) untuk mewujudkan kepunyaan objek (subjek, proses, fenomena, situasi, isyarat) kepada salah satu daripada sebelum ... ... Kamus ensiklopedia

PENGIKTIRAFAN CORAK- bahagian sibernetik matematik yang membangunkan kaedah untuk mengelaskan, serta mengenal pasti objek, fenomena, proses, isyarat, situasi semua objek tersebut yang boleh diterangkan oleh set terhingga ciri atau sifat tertentu, ... ... Ensiklopedia sosiologi Rusia

pengecaman corak- 160 pengecaman corak: Pengenalpastian perwakilan bentuk dan konfigurasi menggunakan cara automatik

Semakan kaedah sedia ada pengecaman corak

L.P. Popova , DAN TENTANG. Datiev

Keupayaan untuk "mengiktiraf" dianggap sebagai harta utama manusia, seperti, sememangnya, organisma hidup yang lain. Pengecaman corak ialah bahagian sibernetik yang membangunkan prinsip dan kaedah untuk mengelas dan mengenal pasti objek, fenomena, proses, isyarat, situasi - semua objek yang boleh diterangkan oleh set terhingga beberapa ciri atau sifat yang mencirikan objek.

Imej ialah perihalan objek. Imej mempunyai sifat ciri, yang menunjukkan dirinya dalam fakta bahawa kenalan dengan nombor terhingga fenomena dari set yang sama memungkinkan untuk mengenali sejumlah besar wakilnya secara sewenang-wenangnya.

Terdapat dua arah utama dalam teori pengecaman corak:

    kajian tentang kuasa pengiktirafan yang dimiliki oleh manusia dan organisma hidup lain;

    pembangunan teori dan kaedah untuk membina peranti yang direka untuk menyelesaikan masalah individu pengecaman corak dalam kawasan aplikasi tertentu.

Selanjutnya, artikel tersebut menerangkan masalah, prinsip dan kaedah untuk melaksanakan sistem pengecaman corak yang berkaitan dengan pembangunan arah kedua. Bahagian kedua artikel membincangkan kaedah rangkaian saraf pengecaman corak, yang boleh dikaitkan dengan arah pertama teori pengecaman corak.

Masalah membina sistem pengecaman imej

Tugas-tugas yang timbul dalam pembinaan sistem pengecaman corak automatik biasanya boleh dikelaskan kepada beberapa bidang utama. Yang pertama adalah berkaitan dengan pembentangan data awal yang diperolehi sebagai hasil pengukuran untuk objek yang ingin dikenali. masalah sensitiviti. Setiap nilai yang diukur ialah beberapa "ciri imej atau objek. Katakan, sebagai contoh, imej itu ialah aksara abjad angka. Dalam kes ini, retina pengukur, serupa dengan yang ditunjukkan dalam Rajah 1(a), boleh digunakan dengan jayanya dalam sensor. Jika retina terdiri daripada unsur-n, maka hasil pengukuran boleh diwakili sebagai vektor ukuran atau vektor imej ,

di mana setiap elemen xi mengambil, sebagai contoh, nilai 1 jika imej simbol melalui sel ke-i retina, dan nilai 0 sebaliknya.

Pertimbangkan Rajah. 2(b). Dalam kes ini, imej adalah fungsi berterusan (daripada jenis isyarat bunyi) pembolehubah t. Jika nilai fungsi diukur pada titik diskret t1,t2, ..., tn, maka vektor imej boleh dibentuk dengan mengambil x1= f(t1),x2=f(t2),... , xn = f(tn).

Rajah 1. Mengukur retina

Masalah kedua pengecaman corak adalah berkaitan dengan pemilihan ciri ciri atau sifat daripada data awal yang diperoleh dan mengurangkan dimensi vektor imej. Masalah ini sering ditakrifkan sebagai masalah prapemprosesan dan pemilihan ciri.

Ciri-ciri kelas imej ialah sifat ciri, biasa kepada semua imej kelas ini. Ciri-ciri yang mencirikan perbezaan antara kelas individu boleh ditafsirkan sebagai ciri antara kelas. Ciri-ciri intrakelas yang biasa kepada semua kelas yang sedang dipertimbangkan tidak dibawa informasi berguna dari segi pengiktirafan dan mungkin tidak diambil kira. Pemilihan ciri dianggap sebagai salah satu tugas penting berkaitan dengan pembinaan sistem pengecaman. Jika keputusan pengukuran memungkinkan untuk mendapatkan set lengkap ciri pembezaan untuk semua kelas, pengecaman dan pengelasan corak sebenar tidak akan menyebabkan sebarang kesulitan tertentu. Pengecaman automatik kemudiannya akan dikurangkan kepada proses pemadanan yang mudah atau prosedur seperti carian jadual. Dalam kebanyakan masalah pengecaman praktikal, bagaimanapun, definisi set lengkap ciri membezakan ternyata sangat sukar, jika tidak mustahil sama sekali. Daripada data asal, biasanya mungkin untuk mengekstrak beberapa ciri yang membezakan dan menggunakannya untuk memudahkan proses pengecaman corak automatik. Khususnya, dimensi vektor pengukuran boleh dikurangkan menggunakan transformasi yang meminimumkan kehilangan maklumat.

Masalah ketiga yang berkaitan dengan pembinaan sistem pengecaman corak adalah untuk mencari prosedur keputusan optimum yang diperlukan untuk pengenalpastian dan pengelasan. Selepas data yang dikumpul tentang corak yang akan dikenal pasti diwakili oleh titik atau vektor ukuran dalam ruang corak, biarkan mesin mengetahui kelas corak mana yang sepadan dengan data ini. Biarkan mesin direka bentuk untuk membezakan antara kelas M, dilambangkan dengan w1, w2, ... ..., wm. Dalam kes ini, ruang imej boleh dianggap terdiri daripada kawasan M, setiap satunya mengandungi titik yang sepadan dengan imej dari kelas yang sama. Dalam kes ini, masalah pengecaman boleh dianggap sebagai membina sempadan wilayah keputusan yang memisahkan kelas M berdasarkan vektor ukuran berdaftar. Biarkan sempadan ini ditakrifkan, sebagai contoh, oleh fungsi keputusan d1(х),d2(x),..., dm(х). Fungsi ini, juga dipanggil fungsi diskriminasi, ialah fungsi skalar dan nilai tunggal bagi imej x. Jika di (x) > dj (x), maka imej bagi x tergolong dalam kelas w1. Dengan kata lain, jika ke-i penentu fungsi di(x) mempunyai nilai tertinggi, maka ilustrasi yang bermakna bagi skim pengelasan automatik sedemikian berdasarkan pelaksanaan proses membuat keputusan ditunjukkan dalam Rajah. 2 (pada skema "GR" - penjana fungsi penentu).

Rajah 2. Skim pengelasan automatik.

Fungsi keputusan boleh diperolehi dalam beberapa cara. Dalam kes-kes di mana maklumat apriori lengkap tersedia tentang corak yang boleh dikenali, fungsi keputusan boleh ditentukan dengan tepat berdasarkan maklumat ini. Jika hanya maklumat kualitatif yang tersedia mengenai corak, andaian munasabah boleh dibuat tentang bentuk fungsi keputusan. Dalam kes kedua, sempadan wilayah keputusan boleh menyimpang dengan ketara daripada yang sebenar, dan oleh itu adalah perlu untuk mewujudkan sistem yang mampu mencapai hasil yang memuaskan melalui satu siri pelarasan berturut-turut.

Objek (imej) yang ingin dikenali dan dikelaskan menggunakan sistem pengecaman corak automatik mesti mempunyai satu set ciri yang boleh diukur. Apabila untuk keseluruhan kumpulan imej hasil ukuran yang sepadan adalah serupa, ia dianggap objek ini tergolong dalam kelas yang sama. Tujuan sistem pengecaman corak adalah untuk menentukan, berdasarkan maklumat yang dikumpul, kelas objek dengan ciri yang serupa dengan yang diukur untuk objek yang boleh dikenali. Ketepatan pengecaman bergantung pada jumlah maklumat membezakan yang terkandung dalam ciri yang diukur, dan kecekapan menggunakan maklumat ini.

      Kaedah Asas untuk Melaksanakan Sistem Pengecaman Corak

Pengecaman corak ialah tugas untuk membina dan menggunakan operasi formal pada perwakilan berangka atau simbolik objek dunia sebenar atau ideal, hasilnya, penyelesaiannya mencerminkan hubungan kesetaraan antara objek ini. Hubungan kesetaraan menyatakan kepunyaan objek yang dinilai kepada beberapa kelas, dianggap sebagai unit semantik bebas.

Semasa membina algoritma pengecaman, kelas kesetaraan boleh ditetapkan oleh penyelidik yang menggunakan idea sendiri yang bermakna atau menggunakan maklumat tambahan luaran tentang persamaan dan perbezaan objek dalam konteks masalah yang sedang diselesaikan. Kemudian seseorang bercakap tentang "arif dengan guru." Jika tidak, i.e. apabila sistem automatik menyelesaikan masalah klasifikasi tanpa melibatkan maklumat latihan luaran, seseorang bercakap tentang pengelasan automatik atau "pengiktirafan tanpa pengawasan". Kebanyakan algoritma pengecaman corak memerlukan penglibatan kuasa pengkomputeran yang sangat ketara, yang hanya boleh disediakan oleh teknologi komputer berprestasi tinggi.

Pelbagai pengarang (Yu.L. Barabash, V.I. Vasiliev, A.L. Gorelik, V.A. Skripkin, R. Duda, P. Hart, L.T. Kuzin, F.I. Peregudov, F.P. Tarasenko, Temnikov F.E., Afonin V.A., Dmitriev V., R. Gonzalez, P. Winston, K. Fu, Ya.Z. Tsypkin dan lain-lain) memberikan tipologi kaedah pengecaman corak yang berbeza. Sesetengah pengarang membezakan antara parametrik, bukan parametrik dan kaedah heuristik, yang lain - membezakan kumpulan kaedah berdasarkan sekolah dan trend yang ditubuhkan secara sejarah dalam bidang ini.

Pada masa yang sama, tipologi yang terkenal tidak mengambil kira satu ciri yang sangat penting, yang mencerminkan spesifik cara penyampaian pengetahuan tentang bidang subjek menggunakan beberapa algoritma pengecaman corak formal. D.A. Pospelov mengenal pasti dua cara utama untuk mewakili pengetahuan:

    Perwakilan Intensional - dalam bentuk gambar rajah hubungan antara atribut (ciri).

    Perwakilan lanjutan - menggunakan fakta konkrit(objek, contoh).

Perlu diingatkan bahawa kewujudan dua kumpulan kaedah pengecaman ini: yang beroperasi dengan ciri dan yang beroperasi dengan objek, adalah sangat semula jadi. Dari sudut pandangan ini, tiada satu pun daripada kaedah ini, diambil secara berasingan daripada yang lain, memungkinkan untuk membentuk refleksi yang mencukupi bagi kawasan subjek. Di antara kaedah-kaedah ini terdapat hubungan saling melengkapi dalam pengertian N. Bohr, oleh itu, sistem pengiktirafan yang menjanjikan harus menyediakan pelaksanaan kedua-dua kaedah ini, dan bukan hanya salah satu daripadanya.

Oleh itu, klasifikasi kaedah pengiktirafan yang dicadangkan oleh D.A. Pospelov adalah berdasarkan undang-undang asas yang mendasari cara kognisi manusia secara umum, yang meletakkannya dalam kedudukan yang sangat istimewa (terutama) berbanding dengan klasifikasi lain, yang, terhadap latar belakang ini, kelihatan. lebih ringan dan tiruan.

Kaedah Intensional

Ciri tersendiri kaedah intensi ialah mereka menggunakan ciri ciri yang berbeza dan hubungannya sebagai elemen operasi dalam pembinaan dan aplikasi algoritma pengecaman corak. Elemen sedemikian boleh nilai individu atau selang nilai ciri, nilai min dan varians, matriks hubungan ciri, dsb., yang mana tindakan dilakukan, dinyatakan dalam bentuk analitikal atau membina. Pada masa yang sama, objek dalam kaedah ini tidak dianggap sebagai unit maklumat penting, tetapi bertindak sebagai penunjuk untuk menilai interaksi dan tingkah laku atribut mereka.

Kumpulan kaedah pengecaman corak intensional adalah luas, dan pembahagiannya kepada subkelas agak sewenang-wenangnya:

– kaedah berdasarkan anggaran ketumpatan taburan nilai ciri

– kaedah berdasarkan andaian tentang kelas fungsi keputusan

– kaedah logik

– kaedah linguistik (struktural).

Kaedah berdasarkan anggaran kepadatan taburan nilai ciri. Kaedah pengecaman corak ini dipinjam daripada teori klasik keputusan statistik, di mana objek kajian dianggap sebagai pelaksanaan multidimensi. pembolehubah rawak diedarkan dalam ruang ciri mengikut beberapa undang-undang. Ia adalah berdasarkan skim membuat keputusan Bayesian yang menarik kepada kebarangkalian priori objek kepunyaan kelas tertentu yang boleh dikenali dan ketumpatan pengedaran bersyarat bagi nilai vektor ciri. Kaedah ini dikurangkan kepada menentukan nisbah kebarangkalian dalam kawasan berbeza ruang ciri berbilang dimensi.

Kumpulan kaedah berdasarkan anggaran ketumpatan taburan nilai ciri secara langsung berkaitan dengan kaedah analisis diskriminasi. Pendekatan Bayesian untuk membuat keputusan adalah salah satu yang paling maju dalam statistik moden, kaedah parametrik yang dipanggil, yang mana ungkapan analitik undang-undang pengedaran dianggap diketahui (dalam kes ini undang-undang biasa) dan hanya sebilangan kecil parameter perlu dianggarkan (min vektor dan matriks kovarians).

Kumpulan ini juga termasuk kaedah untuk mengira nisbah kemungkinan untuk ciri bebas. Kaedah ini, dengan pengecualian andaian kebebasan ciri (yang pada hakikatnya hampir tidak pernah dipenuhi), tidak memerlukan pengetahuan tentang bentuk fungsi undang-undang pengedaran. Ia boleh dikaitkan dengan kaedah bukan parametrik.

Kaedah bukan parametrik lain, digunakan apabila bentuk lengkung ketumpatan taburan tidak diketahui dan tiada andaian boleh dibuat tentang sifatnya sama sekali, menduduki kedudukan istimewa. Ini termasuk kaedah histogram berbilang dimensi yang terkenal, kaedah "jiran terhampir k", kaedah jarak Euclidean, kaedah fungsi berpotensi, dsb., yang generalisasinya ialah kaedah yang dipanggil "anggaran Parzen". Kaedah ini secara rasmi beroperasi dengan objek sebagai struktur kamiran, tetapi bergantung pada jenis tugas pengecaman, mereka boleh bertindak dalam hipostasis intensif dan lanjutan.

Kaedah bukan parametrik menganalisis bilangan relatif objek yang jatuh ke dalam isipadu multidimensi yang diberikan dan menggunakan pelbagai fungsi jarak antara objek sampel latihan dan objek yang dikenali. Untuk sifat kuantitatif, apabila bilangannya jauh lebih kecil daripada saiz sampel, operasi dengan objek memainkan peranan perantaraan dalam menganggarkan kepadatan taburan tempatan kebarangkalian bersyarat dan objek tidak membawa beban semantik unit maklumat bebas. Pada masa yang sama, apabila bilangan ciri adalah sepadan atau lebih banyak nombor daripada objek yang dikaji, dan ciri-cirinya adalah bersifat kualitatif atau dikotomi, maka tidak boleh diperkatakan tentang sebarang anggaran tempatan ketumpatan taburan kebarangkalian. Dalam kes ini, objek dalam kaedah bukan parametrik ini dianggap sebagai unit maklumat bebas (fakta empirikal holistik) dan kaedah ini memperoleh makna penilaian persamaan dan perbezaan objek yang dikaji.

Oleh itu, operasi teknologi yang sama bagi kaedah bukan parametrik, bergantung pada keadaan masalah, masuk akal sama ada anggaran tempatan ketumpatan taburan kebarangkalian nilai ciri, atau anggaran persamaan dan perbezaan objek.

Dalam konteks perwakilan intensif pengetahuan, bahagian pertama kaedah bukan parametrik dipertimbangkan di sini, sebagai anggaran kepadatan taburan kebarangkalian. Ramai pengarang ambil perhatian bahawa kaedah bukan parametrik seperti anggaran Parzen berfungsi dengan baik dalam amalan. Kesukaran utama dalam menggunakan kaedah ini adalah keperluan untuk mengingati keseluruhan sampel latihan untuk mengira anggaran ketumpatan taburan kebarangkalian tempatan dan kepekaan yang tinggi terhadap ketakwakilan sampel latihan.

Kaedah berdasarkan andaian tentang kelas fungsi keputusan. Dalam kumpulan kaedah ini, bentuk umum fungsi keputusan dianggap diketahui dan fungsi kualitinya diberikan. Berdasarkan fungsi ini, anggaran terbaik bagi fungsi keputusan dicari untuk urutan latihan. Yang paling biasa ialah perwakilan fungsi keputusan dalam bentuk polinomial tak linear linear dan umum. Fungsi kualiti peraturan keputusan biasanya dikaitkan dengan ralat pengelasan.

Kelebihan utama kaedah berdasarkan andaian tentang kelas fungsi keputusan ialah kejelasan rumusan matematik masalah pengecaman sebagai masalah mencari ekstrem. Penyelesaian kepada masalah ini sering dicapai menggunakan beberapa jenis algoritma kecerunan. Kepelbagaian kaedah kumpulan ini dijelaskan oleh pelbagai fungsi kualiti peraturan keputusan yang digunakan dan algoritma carian melampau. Generalisasi bagi algoritma yang dipertimbangkan, yang termasuk, khususnya, algoritma Newton, algoritma jenis perceptron, dsb., ialah kaedah penghampiran stokastik. Tidak seperti kaedah pengecaman parametrik, kejayaan kumpulan kaedah ini tidak begitu bergantung kepada percanggahan antara idea teori tentang hukum pengedaran objek dalam ruang ciri dan realiti empirikal. Semua operasi tertakluk kepada satu matlamat utama- mencari keterlaluan fungsi kualiti peraturan keputusan. Pada masa yang sama, keputusan parametrik dan kaedah yang dipertimbangkan mungkin serupa. Seperti yang ditunjukkan di atas, kaedah parametrik untuk kes itu taburan normal objek dalam kelas yang berbeza dengan matriks kovarians yang sama membawa kepada fungsi keputusan linear. Kami juga ambil perhatian bahawa algoritma untuk memilih ciri bermaklumat dalam model diagnostik linear boleh ditafsirkan sebagai varian tertentu algoritma kecerunan untuk mencari ekstrem.

Kemungkinan algoritma kecerunan untuk carian ekstrem, terutamanya dalam kumpulan linear peraturan keputusan, telah dikaji dengan agak baik. Konvergensi algoritma ini telah dibuktikan hanya untuk kes apabila kelas objek yang boleh dikenali dipaparkan dalam ruang ciri oleh struktur geometri padat. Walau bagaimanapun, keinginan untuk mencapai kualiti yang mencukupi bagi peraturan keputusan selalunya boleh dipenuhi dengan bantuan algoritma yang tidak mempunyai bukti matematik yang ketat tentang penumpuan penyelesaian kepada ekstrem global.

Algoritma ini termasuk kumpulan besar prosedur pengaturcaraan heuristik yang mewakili arah pemodelan evolusi. Pemodelan evolusi ialah kaedah bionik yang dipinjam daripada alam semula jadi. Ia berdasarkan penggunaan mekanisme evolusi yang diketahui untuk menggantikan proses pemodelan bermakna objek kompleks dengan pemodelan fenomenologi evolusinya.

Wakil terkenal pemodelan evolusi dalam pengecaman corak ialah kaedah perakaunan kumpulan hujah (MGUA). GMDH adalah berdasarkan prinsip penyusunan diri, dan algoritma GMDH menghasilkan semula skema pemilihan jisim. Dalam algoritma GMDH, ahli polinomial umum disintesis dan dipilih dengan cara yang istimewa, yang sering dipanggil polinomial Kolmogorov-Gabor. Sintesis dan pemilihan ini dijalankan dengan kerumitan yang semakin meningkat, dan adalah mustahil untuk meramalkan terlebih dahulu bentuk akhir polinomial umum. Pertama, kombinasi mudah berpasangan ciri awal biasanya dipertimbangkan, dari mana persamaan fungsi penentu disusun, sebagai peraturan, tidak lebih tinggi daripada susunan kedua. Setiap persamaan dianalisis sebagai fungsi keputusan bebas, dan nilai parameter persamaan yang digubah didapati dalam satu cara atau yang lain dari sampel latihan. Kemudian, daripada set fungsi keputusan yang terhasil, sebahagian daripada yang terbaik dari segi tertentu dipilih. Kualiti fungsi keputusan individu disemak pada sampel kawalan (ujian), yang kadangkala dipanggil prinsip penambahan luaran. Fungsi keputusan separa yang dipilih dianggap di bawah sebagai pembolehubah perantaraan yang berfungsi sebagai hujah awal untuk sintesis serupa bagi fungsi keputusan baharu, dsb. Proses sintesis hierarki sedemikian berterusan sehingga keterlaluan kriteria kualiti fungsi keputusan dicapai, yang dalam amalan menampakkan dirinya dalam kemerosotan kualiti ini apabila cuba meningkatkan lagi susunan ahli polinomial berbanding ciri asal.

Prinsip organisasi diri yang mendasari GMDH dipanggil organisasi kendiri heuristik, kerana keseluruhan proses adalah berdasarkan pengenalan tambahan luaran yang dipilih secara heuristik. Hasil keputusan boleh sangat bergantung pada heuristik ini. Model diagnostik yang terhasil bergantung pada cara objek dibahagikan kepada sampel latihan dan ujian, cara kriteria kualiti pengecaman ditentukan, bilangan pembolehubah yang dilangkau dalam baris pemilihan seterusnya, dsb.

Ciri-ciri algoritma GMDH ini juga merupakan ciri pendekatan lain untuk pemodelan evolusi. Tetapi kami perhatikan di sini satu lagi aspek kaedah yang sedang dipertimbangkan. Ini adalah intipati kandungan mereka. Menggunakan kaedah berdasarkan andaian tentang kelas fungsi keputusan (evolusi dan kecerunan), seseorang boleh membina model diagnostik kerumitan yang tinggi dan dapatkan keputusan yang boleh diterima secara praktikal. Pada masa yang sama, pencapaian matlamat praktikal dalam kes ini tidak disertai dengan pengekstrakan pengetahuan baru tentang sifat objek yang boleh dikenali. Kemungkinan untuk mengekstrak pengetahuan ini, khususnya pengetahuan tentang mekanisme interaksi atribut (ciri), pada asasnya terhad di sini oleh struktur interaksi yang diberikan, ditetapkan dalam bentuk fungsi penentu yang dipilih. Oleh itu, maksimum yang boleh dikatakan selepas membina model diagnostik tertentu ialah menyenaraikan gabungan ciri dan ciri itu sendiri yang disertakan dalam model yang dihasilkan. Tetapi makna gabungan yang mencerminkan sifat dan struktur taburan objek yang dikaji selalunya masih belum ditemui dalam kerangka pendekatan ini.

Kaedah Boolean. Kaedah logik pengecaman corak adalah berdasarkan radas algebra logik dan membolehkan untuk beroperasi dengan maklumat yang terkandung bukan sahaja dalam ciri individu, tetapi juga dalam gabungan nilai ciri. Dalam kaedah ini, nilai mana-mana atribut dianggap sebagai peristiwa asas.

Dalam sangat Pandangan umum kaedah logik boleh dicirikan sebagai sejenis pencarian pola logik dalam sampel latihan dan pembentukan sistem peraturan keputusan logik tertentu (contohnya, dalam bentuk kata hubung peristiwa asas), setiap satunya mempunyai beratnya sendiri. Kumpulan kaedah logik adalah pelbagai dan termasuk kaedah kerumitan dan kedalaman analisis yang berbeza-beza. Untuk ciri dikotomi (boolean), apa yang dipanggil pengelas seperti pokok, kaedah ujian buntu, algoritma Kora dan lain-lain adalah popular. Kaedah yang lebih kompleks adalah berdasarkan pemformalan kaedah induktif D.S. Kilang. Pemformalan dijalankan dengan membina teori kuasi-aksiomatik dan berdasarkan logik berbilang nilai pelbagai dengan pengkuantiti ke atas tupel panjang berubah-ubah.

Algoritma Kora, seperti kaedah logik pengecaman corak yang lain, agak susah payah, kerana penghitungan lengkap diperlukan semasa memilih kata hubung. Oleh itu, apabila menggunakan kaedah logik, keperluan tinggi diletakkan organisasi yang berkesan proses pengiraan, dan kaedah ini berfungsi dengan baik untuk dimensi ruang ciri yang agak kecil dan hanya pada komputer berkuasa.

Kaedah linguistik (sintaktik atau struktur). Kaedah linguistik pengecaman corak adalah berdasarkan penggunaan tatabahasa khas yang menjana bahasa, dengan bantuan satu set sifat objek yang boleh dikenali dapat diterangkan. Tatabahasa merujuk kepada peraturan untuk membina objek daripada unsur bukan terbitan ini.

Sekiranya penerangan imej dibuat dengan bantuan unsur bukan terbitan (sub-imej) dan hubungannya, maka pendekatan linguistik atau sintaksis digunakan untuk membina sistem pengecaman automatik menggunakan prinsip kesamaan sifat. Imej boleh diterangkan menggunakan struktur hierarki subimej yang serupa dengan struktur sintaksis sesuatu bahasa. Keadaan ini memungkinkan untuk mengaplikasikan teori bahasa formal. Diandaikan bahawa tatabahasa imej mengandungi set terhingga unsur yang dipanggil pembolehubah, unsur bukan terbitan dan peraturan penggantian. Sifat peraturan penggantian menentukan jenis tatabahasa. Antara tatabahasa yang paling banyak dikaji ialah tatabahasa tetap, bebas konteks dan tatabahasa juzuk langsung. Perkara utama pendekatan ini ialah pilihan unsur bukan terbitan imej, penyatuan unsur-unsur ini dan hubungan yang menghubungkannya ke dalam tatabahasa imej, dan, akhirnya, pelaksanaan proses analisis dan pengecaman dalam yang sepadan. bahasa. Pendekatan ini amat berguna apabila bekerja dengan imej yang sama ada tidak boleh diterangkan dengan ukuran berangka, atau terlalu kompleks sehingga ciri setempatnya tidak dapat dikenal pasti dan seseorang itu perlu merujuk kepada sifat global objek.

Contohnya, E.A. Butakov, V.I. Ostrovsky, I.L. Fadeev mencadangkan struktur sistem berikut untuk pemprosesan imej (Rajah 3), menggunakan pendekatan linguistik, di mana setiap blok berfungsi adalah kompleks (modul) perisian (program mikro) yang melaksanakan fungsi yang sepadan.

Rajah 3 Skim struktur peranti pengecaman

Percubaan untuk menggunakan kaedah linguistik matematik kepada masalah analisis imej membawa kepada keperluan untuk menyelesaikan beberapa masalah yang berkaitan dengan pemetaan struktur imej dua dimensi ke dalam rantai satu dimensi bahasa formal.

Kaedah Lanjutan

Dalam kaedah kumpulan ini, berbeza dengan arah intensional, setiap objek yang dikaji diberi nilai diagnostik bebas ke tahap yang lebih besar atau lebih kecil. Pada teras mereka, kaedah ini hampir dengan pendekatan klinikal, yang menganggap orang bukan sebagai rantaian objek yang disusun mengikut satu atau penunjuk lain, tetapi sebagai sistem integral, setiap satunya adalah individu dan mempunyai nilai diagnostik khas. Sikap berhati-hati terhadap objek kajian tidak membenarkan seseorang untuk mengecualikan atau kehilangan maklumat tentang setiap objek individu, yang berlaku apabila menggunakan kaedah arah yang disengajakan, menggunakan objek hanya untuk mengesan dan membetulkan corak tingkah laku sifat mereka.

Operasi utama dalam pengecaman corak menggunakan kaedah yang dibincangkan ialah operasi menentukan persamaan dan perbezaan objek. Objek dalam kumpulan kaedah yang ditentukan memainkan peranan sebagai preseden diagnostik. Pada masa yang sama, bergantung pada syarat tugas tertentu, peranan preseden individu boleh berbeza-beza dalam had yang paling luas: daripada penyertaan utama dan penentu kepada penyertaan tidak langsung dalam proses pengiktirafan. Sebaliknya, keadaan masalah mungkin memerlukan penyertaan bilangan preseden diagnostik yang berbeza untuk penyelesaian yang berjaya: daripada satu dalam setiap kelas yang boleh dikenali kepada saiz sampel penuh, serta cara yang berbeza pengiraan ukuran persamaan dan perbezaan objek. Keperluan ini menerangkan pembahagian kaedah lanjutan ke dalam subkelas:

    kaedah perbandingan prototaip;

    kaedah k-jiran terdekat;

    kumpulan peraturan keputusan.

Kaedah perbandingan prototaip. Ini ialah kaedah pengecaman lanjutan yang paling mudah. Ia digunakan, sebagai contoh, apabila kelas yang diiktiraf dipaparkan dalam ruang ciri dalam kumpulan geometri padat. Dalam kes ini, pusat kumpulan geometri kelas (atau objek yang paling hampir dengan pusat) biasanya dipilih sebagai titik prototaip.

Untuk mengklasifikasikan objek yang tidak diketahui, prototaip yang paling hampir dengannya ditemui, dan objek itu tergolong dalam kelas yang sama dengan prototaip ini. Jelas sekali, tiada imej kelas umum terbentuk dalam kaedah ini.

Pelbagai jenis jarak boleh digunakan sebagai ukuran kedekatan. Selalunya untuk ciri dikotomi, jarak Hamming digunakan, yang dalam kes ini adalah sama dengan kuasa dua jarak Euclidean. Dalam kes ini, peraturan keputusan untuk mengelaskan objek adalah bersamaan dengan fungsi keputusan linear.

Fakta ini perlu diberi perhatian khusus. Ia jelas menunjukkan hubungan antara prototaip dan perwakilan indikatif maklumat tentang struktur data. Menggunakan perwakilan di atas, sebagai contoh, sebarang skala pengukur tradisional, yang merupakan fungsi linear bagi nilai ciri dikotomi, boleh dianggap sebagai prototaip diagnostik hipotesis. Sebaliknya, jika analisis struktur spatial kelas yang diiktiraf membolehkan kita membuat kesimpulan bahawa ia adalah padat secara geometri, maka sudah cukup untuk menggantikan setiap kelas ini dengan satu prototaip, yang sebenarnya bersamaan dengan model diagnostik linear.

Dalam amalan, sudah tentu, keadaan sering berbeza daripada contoh ideal yang diterangkan. Seorang penyelidik yang berhasrat untuk menggunakan kaedah pengecaman berdasarkan perbandingan dengan prototaip kelas diagnostik menghadapi masalah yang sukar. Ini adalah, pertama sekali, pilihan ukuran kedekatan (metrik), yang boleh mengubah konfigurasi spatial pengedaran objek dengan ketara. Dan, kedua, masalah bebas ialah analisis struktur multidimensi data eksperimen. Kedua-dua masalah ini amat akut bagi penyelidik di bawah keadaan ruang ciri berdimensi tinggi, yang tipikal untuk masalah sebenar.

Kaedah k-jiran terdekat. Kaedah jiran terhampir k untuk menyelesaikan masalah analisis diskriminasi pertama kali dicadangkan pada tahun 1952. Ia adalah seperti berikut.

Apabila mengelaskan objek yang tidak diketahui, nombor tertentu (k) objek lain yang paling hampir secara geometri dengannya dalam ruang ciri (jiran terdekat) yang sudah diketahui tergolong dalam kelas yang boleh dikenali ditemui. Keputusan untuk menetapkan objek yang tidak diketahui kepada kelas diagnostik tertentu dibuat dengan menganalisis maklumat tentang keahlian diketahui jiran terdekatnya, sebagai contoh, menggunakan kiraan undi yang mudah.

Pada mulanya, kaedah jiran terhampir k dianggap sebagai kaedah bukan parametrik untuk menganggar nisbah kemungkinan. Untuk kaedah ini, anggaran teori keberkesanannya diperolehi berbanding dengan pengelas Bayesian yang optimum. Dibuktikan bahawa kebarangkalian ralat asimptotik untuk kaedah jiran terhampir k melebihi ralat peraturan Bayes tidak lebih daripada dua kali.

Seperti yang dinyatakan di atas, dalam tugasan sebenar selalunya ia perlu untuk beroperasi dengan objek yang diterangkan oleh sebilangan besar ciri kualitatif (dikotomi). Pada masa yang sama, dimensi ruang ciri adalah sepadan dengan atau melebihi volum sampel yang dikaji. Di bawah keadaan sedemikian, adalah mudah untuk mentafsir setiap objek sampel latihan sebagai pengelas linear yang berasingan. Kemudian kelas diagnostik ini atau itu diwakili bukan oleh satu prototaip, tetapi oleh satu set pengelas linear. Interaksi gabungan pengelas linear menghasilkan permukaan linear sekeping yang memisahkan kelas yang boleh dikenali dalam ruang ciri. Jenis permukaan pembahagi, yang terdiri daripada kepingan hyperplanes, boleh diubah dan bergantung kepada kedudukan relatif koleksi terperingkat.

Satu lagi tafsiran mekanisme klasifikasi jiran k-terdekat juga boleh digunakan. Ia berdasarkan idea kewujudan beberapa pembolehubah terpendam, abstrak atau berkaitan dengan beberapa transformasi dengan ruang ciri asal. Jika dalam ruang pembolehubah pendam jarak berpasangan antara objek adalah sama seperti dalam ruang ciri awal, dan bilangan pembolehubah ini adalah ketara kurang daripada bilangan objek, maka tafsiran kaedah jiran k-terdekat boleh dipertimbangkan dari sudut perbandingan anggaran bukan parametrik ketumpatan taburan kebarangkalian bersyarat. Konsep pembolehubah terpendam yang dibentangkan di sini adalah dekat dengan konsep dimensi sebenar dan perwakilan lain yang digunakan dalam pelbagai kaedah pengurangan dimensi.

Apabila menggunakan kaedah k-nerest neighbors untuk pengecaman corak, penyelidik perlu menyelesaikan masalah sukar memilih metrik untuk menentukan kedekatan objek yang didiagnosis. Masalah ini dalam keadaan dimensi tinggi ruang ciri adalah sangat teruk disebabkan oleh intensiti buruh yang mencukupi. kaedah ini, yang menjadi penting walaupun untuk komputer berprestasi tinggi. Oleh itu, di sini, serta dalam kaedah perbandingan dengan prototaip, adalah perlu untuk membuat keputusan tugas kreatif analisis struktur multidimensi data eksperimen untuk meminimumkan bilangan objek yang mewakili kelas diagnostik.

Algoritma untuk mengira gred (mengundi). Prinsip operasi algoritma penilaian (ABO) adalah untuk mengira keutamaan (skor persamaan) yang mencirikan "kehampiran" objek yang diiktiraf dan rujukan mengikut sistem ensembel ciri, yang merupakan sistem subset bagi set tertentu. daripada ciri.

Tidak seperti semua kaedah yang dipertimbangkan sebelum ini, algoritma untuk mengira anggaran beroperasi dengan penerangan objek dengan cara yang asasnya baharu. Untuk algoritma ini, objek wujud serentak dalam subruang yang sangat berbeza bagi ruang ciri. Kelas ABO membawa idea menggunakan ciri kepada kesimpulan logiknya: kerana tidak selalu diketahui gabungan ciri mana yang paling bermaklumat, dalam ABO tahap persamaan objek dikira dengan membandingkan semua gabungan ciri yang mungkin atau tertentu. termasuk dalam huraian objek.

Pasukan peraturan keputusan. Peraturan keputusan menggunakan skim pengecaman dua peringkat. Pada peringkat pertama, algoritma pengecaman peribadi berfungsi, hasilnya digabungkan pada tahap kedua dalam blok sintesis. Kaedah yang paling biasa bagi gabungan sedemikian adalah berdasarkan peruntukan bidang kecekapan algoritma tertentu. Cara paling mudah mencari bidang kecekapan terdiri daripada pembahagian priori ruang ciri berdasarkan pertimbangan profesional sains tertentu (contohnya, stratifikasi sampel mengikut beberapa ciri). Kemudian, untuk setiap kawasan yang dipilih, algoritma pengecamannya sendiri dibina. Kaedah lain adalah berdasarkan penggunaan analisis formal untuk menentukan kawasan tempatan ruang ciri sebagai kejiranan objek yang boleh dikenali yang mana kejayaan algoritma pengecaman tertentu telah terbukti.

Paling pendekatan umum kepada pembinaan blok sintesis, menganggap penunjuk yang terhasil bagi algoritma tertentu sebagai ciri awal untuk membina peraturan keputusan umum yang baharu. Dalam kes ini, semua kaedah arah intensional dan lanjutan di atas dalam pengecaman corak boleh digunakan. Berkesan untuk menyelesaikan masalah mencipta satu set peraturan keputusan adalah algoritma logik jenis "Kora" dan algoritma untuk mengira anggaran (ABO), yang merupakan asas kepada pendekatan algebra yang dipanggil, yang menyediakan penyelidikan dan penerangan yang membina algoritma pengecaman, di mana semua jenis algoritma sedia ada sesuai.

Kaedah rangkaian saraf

Kaedah rangkaian saraf adalah kaedah berdasarkan aplikasi pelbagai jenis rangkaian saraf (NN). Bidang utama penggunaan pelbagai NN untuk pengecaman corak dan imej:

    aplikasi untuk mengekstrak ciri atau ciri utama imej yang diberikan,

    klasifikasi imej itu sendiri atau ciri yang telah diekstrak daripadanya (dalam kes pertama, pengekstrakan ciri utama berlaku secara tersirat dalam rangkaian),

    penyelesaian masalah pengoptimuman.

Berbilang lapisan rangkaian saraf. Seni bina rangkaian saraf berbilang lapisan (MNN) terdiri daripada lapisan yang disambung secara berurutan, di mana neuron setiap lapisan disambungkan dengan semua neuron lapisan sebelumnya dengan inputnya, dan output yang seterusnya.

Aplikasi paling mudah bagi NN satu lapisan (dipanggil memori auto-asosiatif) adalah untuk melatih rangkaian untuk membina semula imej suapan. Dengan memberi imej ujian kepada input dan mengira kualiti imej yang dibina semula, seseorang boleh menganggarkan sejauh mana rangkaian mengenali imej input. Sifat positif kaedah ini ialah rangkaian boleh memulihkan imej yang herot dan bising, tetapi ia tidak sesuai untuk tujuan yang lebih serius.

MNN juga digunakan untuk pengelasan langsung imej - input sama ada imej itu sendiri dalam beberapa bentuk, atau satu set ciri utama imej yang diekstrak sebelum ini, pada output, neuron dengan aktiviti maksimum menunjukkan kepunyaan kelas yang diiktiraf (Rajah . 4). Jika aktiviti ini berada di bawah ambang tertentu, maka ia dianggap bahawa imej yang diserahkan bukan milik mana-mana kelas yang diketahui. Proses pembelajaran menetapkan kesesuaian imej input dengan kepunyaan kelas tertentu. Ini dipanggil pembelajaran terselia. Pendekatan ini bagus untuk tugas kawalan akses untuk sekumpulan kecil orang. Pendekatan ini memberikan perbandingan langsung imej itu sendiri oleh rangkaian, tetapi dengan peningkatan dalam bilangan kelas, masa latihan dan operasi rangkaian meningkat secara eksponen. Oleh itu, untuk tugas seperti mencari orang yang serupa dalam pangkalan data yang besar, ia memerlukan mengekstrak set ciri utama yang padat untuk mencari.

Pendekatan pengelasan menggunakan ciri frekuensi keseluruhan imej diterangkan dalam . NS satu lapisan berdasarkan neuron berbilang nilai telah digunakan.

B menunjukkan penggunaan NN untuk pengelasan imej, apabila input rangkaian menerima hasil penguraian imej melalui kaedah komponen utama.

Dalam MNS klasik, sambungan saraf interlayer disambungkan sepenuhnya, dan imej diwakili sebagai vektor satu dimensi, walaupun ia adalah dua dimensi. Seni bina rangkaian neural convolutional bertujuan untuk mengatasi kelemahan ini. Ia menggunakan medan reseptor tempatan (menyediakan sambungan dua dimensi tempatan neuron), pemberat am (menyediakan pengesanan beberapa ciri di mana-mana dalam imej), dan organisasi hierarki dengan subsampel ruang (subsampel ruang). Convolutional NN (CNN) memberikan rintangan separa terhadap perubahan skala, anjakan, putaran, herotan.

MNS juga digunakan untuk mengesan objek dari jenis tertentu. Selain fakta bahawa mana-mana MNS terlatih boleh sedikit sebanyak menentukan kepunyaan imej kepada kelas "sendiri", ia boleh dilatih khas untuk mengesan kelas tertentu dengan pasti. Dalam kes ini, kelas output akan menjadi kelas yang tergolong dan bukan milik jenis imej yang diberikan. Pengesan rangkaian saraf digunakan untuk mengesan imej muka dalam imej input. Imej telah diimbas dengan tetingkap 20x20 piksel, yang disalurkan kepada input rangkaian, yang menentukan sama ada kawasan yang diberikan tergolong dalam kelas muka. Latihan dijalankan menggunakan contoh yang baik (pelbagai imej muka) dan negatif (imej yang bukan muka). Untuk meningkatkan kebolehpercayaan pengesanan, sekumpulan NN yang dilatih dengan pemberat awal yang berbeza telah digunakan, akibatnya NN membuat kesilapan dalam cara yang berbeza, dan keputusan terakhir diterima pakai oleh undi seluruh pasukan.

Rajah 5. Komponen utama (eigenfaces) dan penguraian imej kepada komponen utama

NN juga digunakan untuk mengekstrak ciri utama imej, yang kemudiannya digunakan untuk pengelasan seterusnya. Dalam , kaedah untuk pelaksanaan rangkaian saraf kaedah analisis komponen utama ditunjukkan. Intipati kaedah analisis komponen utama adalah untuk mendapatkan pekali hiasan maksimum yang mencirikan corak input. Pekali ini dipanggil komponen utama dan digunakan untuk pemampatan imej statistik, di mana sebilangan kecil pekali digunakan untuk mewakili keseluruhan imej. NN dengan satu lapisan tersembunyi yang mengandungi neuron N (yang jauh lebih kecil daripada dimensi imej), dilatih dengan kaedah perambatan balik ralat untuk memulihkan imej input pada output, menjana pekali komponen utama N pertama pada output neuron tersembunyi, yang digunakan untuk perbandingan. Biasanya, 10 hingga 200 komponen utama digunakan. Apabila nombor komponen bertambah, keterwakilannya berkurangan dengan banyak, dan tidak masuk akal untuk menggunakan komponen dengan bilangan yang besar. Apabila menggunakan fungsi pengaktifan tak linear unsur saraf, penguraian tak linear kepada komponen utama adalah mungkin. Ketaklinieran membolehkan anda menggambarkan variasi dalam data input dengan lebih tepat. Menggunakan analisis komponen utama pada penguraian imej muka, kami memperoleh komponen utama, dipanggil muka wajar, yang juga mempunyai harta yang berguna- terdapat komponen yang mencerminkan ciri-ciri penting seseorang seperti jantina, bangsa, emosi. Apabila dipulihkan, komponen kelihatan seperti muka, dengan bekas paling mencerminkan bentuk umum muka, yang terakhir - pelbagai perbezaan kecil antara muka (Rajah 5). Kaedah ini sesuai digunakan untuk mencari imej wajah yang serupa dalam pangkalan data yang besar. Kemungkinan pengurangan selanjutnya dimensi komponen utama dengan bantuan NS juga ditunjukkan. Dengan menilai kualiti pembinaan semula imej input, seseorang boleh menentukan dengan tepat sama ada ia tergolong dalam kelas muka.

Rangkaian saraf perintah tinggi. Rangkaian saraf tertib tinggi (HNN) berbeza daripada MNN kerana ia hanya mempunyai satu lapisan, tetapi input neuron juga menerima istilah tertib tinggi, yang merupakan hasil darab dua atau lebih komponen vektor input . Rangkaian sedemikian juga boleh membentuk permukaan pemisah yang kompleks.

Rangkaian saraf Hopfield. Hopfield NN (HSH) adalah satu lapisan dan bersambung sepenuhnya (tiada sambungan neuron kepada diri mereka sendiri), outputnya disambungkan dengan input. Tidak seperti MNS, NSH bersifat santai, i.e. ditetapkan kepada keadaan awal, ia berfungsi sehingga ia mencapai keadaan stabil, yang akan menjadi nilai outputnya. Untuk mencari minimum global berhubung dengan masalah pengoptimuman gunakan pengubahsuaian stokastik NSH.

Penggunaan NSH sebagai ingatan bersekutu membolehkan anda memulihkan imej yang rangkaian dilatih dengan tepat apabila imej herot disalurkan ke input. Dalam kes ini, rangkaian akan "mengingat" yang paling dekat (dalam erti kata minimum tempatan tenaga) imej, dan dengan itu mengenalinya. Fungsi sedemikian juga boleh dianggap sebagai aplikasi berurutan bagi memori auto-asosiatif yang diterangkan di atas. Tidak seperti memori auto-asosiatif, NSH akan memulihkan imej dengan sempurna dengan tepat. Untuk mengelakkan gangguan minima dan meningkatkan kapasiti rangkaian, gunakan pelbagai kaedah.

Rangkaian saraf penganjur sendiri Kohonen. Rangkaian saraf penganjur sendiri Kohonen (SNNC) menyediakan susunan topologi ruang imej input. Mereka membenarkan pemetaan topologi berterusan input ruang n-dimensi kepada output m-dimensi, m<

Cognitron. Kognitron dalam seni binanya adalah serupa dengan struktur korteks visual, ia mempunyai organisasi berbilang lapisan hierarki, di mana neuron antara lapisan disambungkan hanya secara tempatan. Dilatih dengan pembelajaran kompetitif (tanpa guru). Setiap lapisan otak melaksanakan tahap generalisasi yang berbeza; lapisan input sensitif kepada corak mudah, seperti garisan, dan orientasinya di kawasan tertentu kawasan visual, manakala tindak balas lapisan lain adalah lebih kompleks, abstrak dan bebas daripada kedudukan corak. Fungsi serupa dilaksanakan dalam kognitron dengan memodelkan organisasi korteks visual.

Neocognitron ialah perkembangan lanjut idea kognitron dan lebih tepat menggambarkan struktur sistem visual, membolehkan anda mengenali imej tanpa mengira perubahan, putaran, herotan dan perubahan skalanya.

Cognitron ialah alat pengecaman imej yang berkuasa, namun, ia memerlukan kos pengiraan yang tinggi, yang pada masa ini tidak dapat dicapai.

Kaedah rangkaian saraf yang dipertimbangkan memberikan pengecaman imej yang pantas dan boleh dipercayai, tetapi apabila menggunakan kaedah ini, masalah timbul dalam pengecaman objek tiga dimensi. Walau bagaimanapun, pendekatan ini mempunyai banyak kelebihan.

      Kesimpulan

Pada masa ini, terdapat sejumlah besar sistem pengecaman corak automatik untuk pelbagai masalah yang digunakan.

Pengecaman corak melalui kaedah formal sebagai hala tuju saintifik asas tidak habis-habis.

Kaedah matematik pemprosesan imej mempunyai pelbagai aplikasi: sains, teknologi, perubatan, sfera sosial. Pada masa hadapan, peranan pengecaman pola dalam kehidupan manusia akan semakin meningkat.

Kaedah rangkaian saraf menyediakan pengecaman imej yang pantas dan boleh dipercayai. Pendekatan ini mempunyai banyak kelebihan dan merupakan salah satu yang paling menjanjikan.

kesusasteraan

    D.V. Brilyuk, V.V. Starovoitov. Kaedah rangkaian saraf pengecaman imej // /

    Kuzin L.T. Asas Sibernetik: Asas Model Sibernetik. T.2. - M.: Tenaga, 1979. - 584 hlm.

    Peregudov F.I., Tarasenko F.P. Pengenalan kepada Analisis Sistem: Buku Teks. - M .: Sekolah Tinggi, 1997. - 389s.

    Temnikov F.E., Afonin V.A., Dmitriev V.I. Asas teori teknologi maklumat. - M.: Tenaga, 1979. - 511s.

    Tu J., Gonzalez R. Prinsip Pengecaman Corak. / Per. dari bahasa Inggeris. - M.: Mir, 1978. - 410s.

    Winston P. Kecerdasan buatan. / Per. dari bahasa Inggeris. - M.: Mir, 1980. - 520an.

    Fu K. Kaedah struktur dalam pengecaman corak: Diterjemah daripada bahasa Inggeris. - M.: Mir, 1977. - 320-an.

    Tsypkin Ya.Z. Asas Teori Maklumat Pengenalan. - M.: Nauka, 1984. - 520-an.

    Pospelov G.S. Kepintaran buatan adalah asas teknologi maklumat baharu. - M.: Nauka, 1988. - 280-an.

    Yu. Lifshits, Kaedah statistik pengecaman corak ///modern/07modernnote.pdf

    Bohr N. Fizik atom dan pengetahuan manusia. / Terjemahan daripada bahasa Inggeris. - M.: Mir, 1961. - 151s.

    Butakov E.A., Ostrovsky V.I., Fadeev I.L. Pemprosesan imej pada komputer.1987.-236s.

    Duda R., Hart P. Pengecaman corak dan analisis pemandangan. / Terjemahan daripada bahasa Inggeris. - M.: Mir, 1978. - 510s.

    Duke V.A. Psikodiagnostik komputer. - St Petersburg: Brotherhood, 1994. - 365 p.

    Aizenberg I. N., Aizenberg N. N. dan Krivosheev G. A. Neuron Perduaan Berbilang nilai dan Universal: Algoritma Pembelajaran, Aplikasi untuk Pemprosesan dan Pengiktirafan Imej. Nota Kuliah dalam Kepintaran Buatan - Pembelajaran Mesin dan Perlombongan Data dalam Pengecaman Corak, 1999, hlm. 21-35.

    Ranganath S. dan Arun K. Pengecaman muka menggunakan ciri transformasi dan rangkaian saraf. Pengecaman Corak 1997, Jld. 30, hlm. 1615-1622.

    Golovko V.A. Neurointelligence: Teori dan Aplikasi. Buku 1. Organisasi dan latihan rangkaian saraf dengan langsung dan maklum balas - Brest: BPI, 1999, - 260-an.

    Vetter T. dan Poggio T. Kelas Objek Linear dan Sintesis Imej Daripada Imej Contoh Tunggal. IEEE Transactions on Pattern Analysis and Machine Intelligence 1997, Vol. 19, hlm. 733-742.

    Golovko V.A. Neurointelligence: Teori dan Aplikasi. Buku 2. Organisasi diri, toleransi kesalahan dan penggunaan rangkaian saraf - Brest: BPI, 1999, - 228s.

    Lawrence S., Giles C. L., Tsoi A. C. dan Belakang A. D. Pengecaman Muka: Pendekatan Rangkaian Neural Konvolusi. Transaksi IEEE pada Rangkaian Neural, Isu Khas mengenai Rangkaian Neural dan Pengecaman Corak, ms. 1-24.

    Wasserman F. Teknologi Neurokomputer: Teori dan amalan, 1992 - 184p.

    Rowley H. A., Baluja S. dan Kanade T. Pengesanan Muka Berasaskan Rangkaian Neural. Transaksi IEEE pada Analisis Corak dan Perisikan Mesin 1998, Vol. 20, hlm. 23-37.

    Valentin D., Abdi H., O "Toole A. J. dan Cottrell G. W. Model penyambung pemprosesan muka: tinjauan. DALAM: Pengecaman Pola 1994, Jilid 27, ms 1209-1230.

    Dokumen

    Mereka membuat algoritma pengiktirafanimej. Kaedahpengiktirafanimej Seperti yang dinyatakan di atas ... realiti tidak wujud"ekosistem secara umum" dan wujud hanya beberapa ... kesimpulan daripada ini terperinci semakankaedahpengiktirafan kami sampaikan dalam...

  1. Gambaran keseluruhan kaedah untuk mengenal pasti orang berdasarkan imej muka, dengan mengambil kira ciri pengecaman visual

    Semakan

    ... pengiktirafan oleh seseorang objek kontras rendah, termasuk. orang. Dibawa semakan biasa kaedah ... wujud keseluruhan baris kaedah ... cara, hasil kajian, platform untuk pembangunan kaedahpengiktirafan ...

  2. Imeni Glazkova Valentina Vladimirovna PENYELIDIKAN DAN PEMBANGUNAN KAEDAH UNTUK PEMBINAAN ALAT PERISIAN UNTUK KLASIFIKASI DOKUMEN HIPERTEKS PELBAGAI TOPIK Keistimewaan 05

    Abstrak disertasi

    dokumen hiperteks. Bab tersebut mengandungi semakansedia adakaedah penyelesaian masalah yang sedang dipertimbangkan, penerangan ... dengan memotong kelas yang paling kurang relevan // Matematik kaedahpengiktirafanimej: Persidangan Seluruh Rusia ke-13. wilayah Leningrad...

  3. Slaid 0 Gambaran keseluruhan tugas-tugas bioinformatik yang berkaitan dengan analisis dan pemprosesan teks genetik

    Syarahan

    Urutan DNA dan protein. Semakan tugas bioinformatik sebagai tugas ... isyarat memerlukan penggunaan moden kaedahpengiktirafanimej, pendekatan statistik dan ... dengan ketumpatan gen yang rendah. sedia ada program ramalan gen tidak...

Bab 3: Kajian Analitikal Pengecaman Corak dan Kaedah Membuat Keputusan

Teori pengecaman corak dan automasi kawalan

Tugas utama pengecaman corak penyesuaian

Pengiktirafan adalah proses maklumat yang dilaksanakan oleh beberapa penukar maklumat (saluran maklumat pintar, sistem pengecaman) yang mempunyai input dan output. Input sistem ialah maklumat tentang ciri-ciri yang ada pada objek yang dibentangkan. Output sistem memaparkan maklumat mengenai kelas mana (imej umum) objek yang boleh dikenali ditugaskan.

Apabila mencipta dan mengendalikan sistem pengecaman corak automatik, beberapa tugas diselesaikan. Mari kita pertimbangkan secara ringkas dan ringkas tugas-tugas ini. Perlu diingatkan bahawa rumusan masalah ini, dan set itu sendiri, tidak bertepatan dengan pengarang yang berbeza, kerana pada tahap tertentu ia bergantung pada model matematik khusus di mana sistem pengecaman ini atau itu didasarkan. Di samping itu, beberapa tugas dalam model pengecaman tertentu tidak mempunyai penyelesaian dan, dengan itu, tidak dikemukakan.

Tugas memformalkan bidang subjek

Sebenarnya, tugas ini adalah tugas pengekodan. Senarai kelas umum disusun, yang mungkin termasuk pelaksanaan khusus objek, serta senarai ciri yang objek ini, pada dasarnya, boleh mempunyai.

Tugas membentuk sampel latihan

Sampel latihan ialah pangkalan data yang mengandungi penerangan tentang pelaksanaan khusus objek dalam bahasa ciri, ditambah dengan maklumat tentang kepunyaan objek ini ke kelas pengecaman tertentu.

Tugas melatih sistem pengecaman

Sampel latihan digunakan untuk membentuk imej umum kelas pengecaman berdasarkan generalisasi maklumat tentang ciri-ciri objek sampel latihan yang dimiliki oleh kelas ini dan kelas lain.

Masalah Pengurangan Dimensi Ruang Ciri

Selepas melatih sistem pengecaman (mendapatkan statistik mengenai taburan frekuensi ciri mengikut kelas), ia menjadi mungkin untuk menentukan bagi setiap ciri nilainya untuk menyelesaikan masalah pengecaman. Selepas itu, ciri yang paling tidak bernilai boleh dialih keluar daripada sistem ciri. Kemudian sistem pengecaman mesti dilatih semula, kerana akibat penyingkiran beberapa ciri, statistik pengedaran ciri yang tinggal mengikut kelas berubah. Proses ini boleh diulang, i.e. menjadi berulang.

Tugas pengiktirafan

Objek sampel yang boleh dikenali dikenali, yang, khususnya, mungkin terdiri daripada satu objek. Sampel yang boleh dikenali dibentuk sama dengan latihan, tetapi tidak mengandungi maklumat tentang kepunyaan objek ke kelas, kerana inilah yang ditentukan dalam proses pengecaman. Hasil pengecaman setiap objek ialah pengedaran atau senarai semua kelas pengecaman dalam susunan menurun bagi tahap persamaan objek yang dikenali dengan mereka.

Tugas kawalan kualiti pengiktirafan

Selepas pengiktirafan, kecukupannya boleh diwujudkan. Untuk objek sampel latihan, ini boleh dilakukan dengan serta-merta, kerana bagi mereka ia hanya diketahui kelas mana mereka berada. Untuk objek lain, maklumat ini boleh diperoleh kemudian. Walau apa pun, kebarangkalian ralat purata sebenar untuk semua kelas pengecaman boleh ditentukan, serta kebarangkalian ralat apabila menetapkan objek yang diiktiraf kepada kelas tertentu.

Keputusan pengiktirafan hendaklah ditafsirkan dengan mengambil kira maklumat yang ada tentang kualiti pengiktirafan.

Tugas penyesuaian

Jika, sebagai hasil daripada prosedur kawalan kualiti, didapati bahawa ia tidak memuaskan, maka perihalan objek yang tidak dikenali boleh disalin daripada sampel yang boleh dikenali kepada latihan, ditambah dengan maklumat pengelasan yang mencukupi, dan digunakan untuk membentuk semula keputusan. peraturan, iaitu diambil kira. Selain itu, jika objek ini tidak tergolong dalam kelas pengecaman yang sedia ada, yang boleh menjadi sebab untuk pengecaman salah mereka, maka senarai ini boleh dikembangkan. Akibatnya, sistem pengecaman menyesuaikan diri dan mula mengklasifikasikan objek ini dengan secukupnya.

Masalah pengecaman songsang

Tugas pengiktirafan ialah untuk objek tertentu, mengikut ciri yang diketahui, sistem menetapkan kepunyaannya kepada beberapa kelas yang tidak diketahui sebelumnya. Dalam masalah pengecaman songsang, sebaliknya, untuk kelas pengecaman yang diberikan, sistem menentukan ciri yang paling ciri bagi objek kelas ini dan yang tidak (atau objek sampel latihan yang tergolong dalam kelas ini).

Tugasan kluster dan analisis konstruktif

Kluster ialah kumpulan objek, kelas atau ciri yang dalam setiap kluster ia adalah sama yang mungkin, dan antara kluster berbeza ia adalah berbeza yang mungkin.

Konstruk (dalam konteks yang dipertimbangkan dalam bahagian ini) ialah sistem kelompok yang bertentangan. Oleh itu, dalam erti kata tertentu, konstruk adalah hasil daripada analisis kelompok kelompok.

Dalam analisis kelompok, tahap persamaan dan perbezaan objek (kelas, ciri) diukur secara kuantitatif, dan maklumat ini digunakan untuk pengelasan. Hasil analisis kluster adalah klasifikasi objek mengikut kluster. Klasifikasi ini boleh diwakili dalam bentuk rangkaian semantik.

Tugas analisis kognitif

Dalam analisis kognitif, maklumat tentang persamaan dan perbezaan kelas atau ciri adalah menarik minat penyelidik itu sendiri, dan bukan untuk menggunakannya untuk pengelasan, seperti dalam analisis kelompok dan konstruktif.

Jika dua kelas pengecaman dicirikan oleh ciri yang sama, maka ini menyumbang kepada persamaan kedua-dua kelas ini. Jika untuk salah satu kelas ciri ini tidak seperti ciri, maka ini menyumbang kepada perbezaan.

Jika dua tanda berkorelasi antara satu sama lain, maka dalam erti kata tertentu ia boleh dianggap sebagai satu tanda, dan jika ia adalah antikorelasi, maka sebagai berbeza. Mengambil kira keadaan ini, kehadiran ciri yang berbeza dalam kelas yang berbeza juga memberi sumbangan tertentu kepada persamaan dan perbezaannya.

Hasil analisis kognitif boleh dipersembahkan dalam bentuk rajah kognitif.

Kaedah pengecaman corak dan ciri-cirinya

Prinsip klasifikasi kaedah pengecaman corak

Pengecaman corak ialah tugas untuk membina dan menggunakan operasi formal pada perwakilan berangka atau simbolik objek dalam dunia sebenar atau ideal, yang hasilnya mencerminkan hubungan kesetaraan antara objek ini. Hubungan kesetaraan menyatakan kepunyaan objek yang dinilai kepada beberapa kelas, dianggap sebagai unit semantik bebas.

Semasa membina algoritma pengecaman, kelas kesetaraan boleh ditetapkan oleh penyelidik yang menggunakan idea sendiri yang bermakna atau menggunakan maklumat tambahan luaran tentang persamaan dan perbezaan objek dalam konteks masalah yang sedang diselesaikan. Kemudian seseorang bercakap tentang "pengiktirafan dengan guru". Jika tidak, i.e. apabila sistem automatik menyelesaikan masalah klasifikasi tanpa melibatkan maklumat latihan luaran, seseorang bercakap tentang pengelasan automatik atau "pengiktirafan tanpa pengawasan". Kebanyakan algoritma pengecaman corak memerlukan penglibatan kuasa pengkomputeran yang sangat ketara, yang hanya boleh disediakan oleh teknologi komputer berprestasi tinggi.

Pelbagai pengarang (Yu.L. Barabash, V.I. Vasiliev, A.L. Gorelik, V.A. Skripkin, R. Duda, P. Hart, L.T. Kuzin, F.I. Peregudov, F.P. Tarasenko, F. E. Temnikov, J. Tu, R. Gonzalez, P. Winston, K. Fu, Ya. Z. Tsypkin dan lain-lain) memberikan tipologi kaedah pengecaman corak yang berbeza. Sesetengah pengarang membezakan antara kaedah parametrik, bukan parametrik dan heuristik, manakala yang lain memilih kumpulan kaedah berdasarkan sekolah sejarah dan trend dalam bidang tersebut. Sebagai contoh, dalam kerja, yang memberikan gambaran keseluruhan akademik kaedah pengecaman, tipologi kaedah pengecaman corak berikut digunakan:

  • kaedah berdasarkan prinsip pemisahan;
  • kaedah statistik;
  • kaedah yang dibina berdasarkan "fungsi berpotensi";
  • kaedah pengiraan gred (mengundi);
  • kaedah berdasarkan kalkulus cadangan, khususnya pada radas algebra logik.

Klasifikasi ini adalah berdasarkan perbezaan dalam kaedah formal pengecaman corak, dan oleh itu pertimbangan pendekatan heuristik untuk pengecaman, yang telah menerima pembangunan penuh dan mencukupi dalam sistem pakar, ditinggalkan. Pendekatan heuristik adalah berdasarkan pengetahuan dan intuisi penyelidik yang sukar untuk diformalkan. Pada masa yang sama, penyelidik sendiri menentukan maklumat apa dan bagaimana sistem harus menggunakan untuk mencapai kesan pengiktirafan yang diingini.

Tipologi kaedah pengecaman yang serupa dengan tahap perincian yang berbeza-beza ditemui dalam banyak karya mengenai pengecaman. Pada masa yang sama, tipologi yang terkenal tidak mengambil kira satu ciri yang sangat penting, yang mencerminkan spesifik cara pengetahuan tentang kawasan subjek diwakili menggunakan beberapa algoritma pengecaman corak formal.

D.A. Pospelov (1990) mengenal pasti dua cara utama untuk mewakili pengetahuan:

  • intensional, dalam bentuk skema hubungan antara atribut (ciri).
  • lanjutan, dengan bantuan fakta khusus (objek, contoh).

Perwakilan intensi menangkap corak dan hubungan yang menerangkan struktur data. Berkenaan dengan tugas diagnostik, penetapan tersebut terdiri daripada menentukan operasi pada atribut (ciri) objek yang membawa kepada hasil diagnostik yang diperlukan. Perwakilan intensi dilaksanakan melalui operasi pada nilai atribut dan tidak membayangkan operasi pada fakta maklumat tertentu (objek).

Sebaliknya, perwakilan tambahan pengetahuan dikaitkan dengan penerangan dan penetapan objek tertentu dari kawasan subjek dan dilaksanakan dalam operasi, unsur-unsurnya adalah objek sebagai sistem integral.

Adalah mungkin untuk membuat analogi antara representasi pengetahuan secara intensif dan lanjutan dan mekanisme yang mendasari aktiviti hemisfera kiri dan kanan otak manusia. Jika hemisfera kanan dicirikan oleh perwakilan prototaip holistik dunia sekeliling, maka hemisfera kiri beroperasi dengan corak yang mencerminkan sambungan sifat-sifat dunia ini.

Dua cara asas perwakilan pengetahuan yang diterangkan di atas membolehkan kami mencadangkan klasifikasi kaedah pengecaman corak berikut:

  • kaedah intensi berdasarkan operasi dengan atribut.
  • kaedah lanjutan berdasarkan operasi dengan objek.

Perlu ditekankan bahawa kewujudan dua (dan hanya dua) kumpulan kaedah pengecaman ini: yang beroperasi dengan ciri dan yang beroperasi dengan objek, adalah sangat semula jadi. Dari sudut pandangan ini, tiada satu pun daripada kaedah ini, diambil secara berasingan daripada yang lain, memungkinkan untuk membentuk refleksi yang mencukupi bagi kawasan subjek. Menurut pengarang, antara kaedah ini terdapat hubungan saling melengkapi dalam pengertian N. Bohr, oleh itu, sistem pengiktirafan yang menjanjikan harus memastikan pelaksanaan kedua-dua kaedah ini, dan bukan hanya salah satu daripadanya.

Oleh itu, klasifikasi kaedah pengiktirafan yang dicadangkan oleh D. A. Pospelov adalah berdasarkan undang-undang asas yang mendasari cara kognisi manusia secara umum, yang meletakkannya dalam kedudukan yang sangat istimewa (terutama) berbanding dengan klasifikasi lain yang kelihatan lebih ringan dan buatan.

Kaedah Intensional

Ciri tersendiri kaedah intensi ialah mereka menggunakan ciri ciri yang berbeza dan hubungannya sebagai elemen operasi dalam pembinaan dan aplikasi algoritma pengecaman corak. Elemen tersebut boleh menjadi nilai individu atau selang nilai ciri, nilai purata dan varians, matriks hubungan ciri, dsb., di mana tindakan dilakukan, dinyatakan dalam bentuk analitikal atau konstruktif. Pada masa yang sama, objek dalam kaedah ini tidak dianggap sebagai unit maklumat penting, tetapi bertindak sebagai penunjuk untuk menilai interaksi dan tingkah laku atribut mereka.

Kumpulan kaedah pengecaman corak intensional adalah meluas, dan pembahagiannya kepada subkelas adalah agak sewenang-wenangnya.

Kaedah berdasarkan anggaran kepadatan taburan nilai ciri

Kaedah pengecaman corak ini dipinjam daripada teori klasik keputusan statistik, di mana objek kajian dianggap sebagai realisasi pembolehubah rawak berbilang dimensi yang diedarkan dalam ruang ciri mengikut beberapa undang-undang. Ia adalah berdasarkan skim membuat keputusan Bayesian yang menarik kepada kebarangkalian priori objek kepunyaan kelas tertentu yang boleh dikenali dan ketumpatan pengedaran bersyarat bagi nilai vektor ciri. Kaedah ini dikurangkan kepada menentukan nisbah kebarangkalian dalam kawasan berbeza ruang ciri berbilang dimensi.

Kumpulan kaedah berdasarkan anggaran ketumpatan taburan nilai ciri secara langsung berkaitan dengan kaedah analisis diskriminasi. Pendekatan Bayesian untuk membuat keputusan adalah salah satu yang paling maju dalam statistik moden, yang dipanggil kaedah parametrik, yang mana ungkapan analitik undang-undang taburan (dalam kes ini, undang-undang biasa) dianggap diketahui, dan hanya sebilangan kecil parameter (vektor min dan matriks kovarians) perlu dianggarkan.

Kesukaran utama dalam menggunakan kaedah ini adalah keperluan untuk mengingati keseluruhan sampel latihan untuk mengira anggaran ketumpatan taburan kebarangkalian tempatan dan kepekaan yang tinggi terhadap ketakwakilan sampel latihan.

Kaedah berdasarkan andaian tentang kelas fungsi keputusan

Dalam kumpulan kaedah ini, bentuk umum fungsi keputusan dianggap diketahui dan fungsi kualitinya diberikan. Berdasarkan fungsi ini, anggaran terbaik bagi fungsi keputusan didapati daripada urutan latihan. Yang paling biasa ialah perwakilan fungsi keputusan dalam bentuk polinomial tak linear linear dan umum. Fungsi kualiti peraturan keputusan biasanya dikaitkan dengan ralat pengelasan.

Kelebihan utama kaedah berdasarkan andaian tentang kelas fungsi keputusan ialah kejelasan rumusan matematik masalah pengecaman sebagai masalah mencari ekstrem. Kepelbagaian kaedah kumpulan ini dijelaskan oleh pelbagai fungsi kualiti peraturan keputusan yang digunakan dan algoritma carian melampau. Generalisasi bagi algoritma yang dipertimbangkan, yang termasuk, khususnya, algoritma Newton, algoritma jenis perceptron, dsb., ialah kaedah penghampiran stokastik.

Kemungkinan algoritma kecerunan untuk mencari ekstrem, terutamanya dalam kumpulan peraturan keputusan linear, telah dikaji dengan baik. Konvergensi algoritma ini telah dibuktikan hanya untuk kes apabila kelas objek yang boleh dikenali dipaparkan dalam ruang ciri oleh struktur geometri padat.

Kualiti peraturan keputusan yang cukup tinggi boleh dicapai menggunakan algoritma yang tidak mempunyai bukti matematik yang ketat tentang penumpuan penyelesaian kepada ekstrem global. Algoritma sedemikian termasuk sekumpulan besar prosedur pengaturcaraan heuristik yang mewakili arah pemodelan evolusi. Pemodelan evolusi ialah kaedah bionik yang dipinjam daripada alam semula jadi. Ia berdasarkan penggunaan mekanisme evolusi yang diketahui untuk menggantikan proses pemodelan bermakna objek kompleks dengan pemodelan fenomenologi evolusinya. Wakil terkenal pemodelan evolusi dalam pengecaman corak ialah kaedah perakaunan kumpulan hujah (MGUA). GMDH adalah berdasarkan prinsip penyusunan diri, dan algoritma GMDH menghasilkan semula skema pemilihan jisim.

Walau bagaimanapun, pencapaian matlamat praktikal dalam kes ini tidak disertai dengan pengekstrakan pengetahuan baru tentang sifat objek yang boleh dikenali. Kemungkinan untuk mengekstrak pengetahuan ini, khususnya pengetahuan tentang mekanisme interaksi atribut (ciri), pada asasnya terhad di sini oleh struktur interaksi yang diberikan, ditetapkan dalam bentuk fungsi penentu yang dipilih.

Kaedah Boolean

Kaedah logik pengecaman corak adalah berdasarkan radas algebra logik dan membolehkan untuk beroperasi dengan maklumat yang terkandung bukan sahaja dalam ciri individu, tetapi juga dalam gabungan nilai ciri. Dalam kaedah ini, nilai mana-mana atribut dianggap sebagai peristiwa asas.

Dalam bentuk yang paling umum, kaedah logik boleh dicirikan sebagai sejenis pencarian pola logik dalam sampel latihan dan pembentukan sistem peraturan keputusan logik tertentu (contohnya, dalam bentuk kata hubung peristiwa asas), setiap yang mempunyai berat sendiri. Kumpulan kaedah logik adalah pelbagai dan termasuk kaedah kerumitan dan kedalaman analisis yang berbeza-beza. Untuk ciri dikotomi (boolean), apa yang dipanggil pengelas seperti pokok, kaedah ujian buntu, algoritma Bark, dll. adalah popular.

Algoritma Kora, seperti kaedah logik pengecaman corak yang lain, agak susah payah dari segi pengiraan, kerana penghitungan yang lengkap diperlukan semasa memilih kata hubung. Oleh itu, apabila menggunakan kaedah logik, keperluan tinggi diletakkan pada organisasi proses pengiraan yang cekap, dan kaedah ini berfungsi dengan baik dengan dimensi ruang ciri yang agak kecil dan hanya pada komputer berkuasa.

Kaedah linguistik (struktural).

Kaedah linguistik pengecaman corak adalah berdasarkan penggunaan tatabahasa khas yang menjana bahasa yang boleh digunakan untuk menggambarkan satu set sifat objek yang boleh dikenali.

Untuk pelbagai kelas objek, unsur bukan terbitan (atom) (subimej, tanda) dan kemungkinan hubungan antara mereka dibezakan. Tatabahasa merujuk kepada peraturan untuk membina objek daripada unsur bukan terbitan ini.

Oleh itu, setiap objek ialah himpunan unsur bukan terbitan, "bersambung" antara satu sama lain dalam satu cara atau yang lain, atau, dengan kata lain, dengan "ayat" beberapa "bahasa". Saya ingin menekankan nilai ideologi yang sangat penting bagi pemikiran ini.

Dengan menghuraikan (menghuraikan) "ayat", "ketepatan" sintaksisnya ditentukan, atau, secara bersamaan, sama ada beberapa tatabahasa tetap yang menerangkan kelas boleh menjana penerangan sedia ada bagi objek.

Walau bagaimanapun, tugas memulihkan (mendefinisikan) tatabahasa daripada set pernyataan tertentu (ayat - keterangan objek) yang menjana bahasa tertentu sukar untuk diformalkan.

Kaedah Lanjutan

Dalam kaedah kumpulan ini, berbeza dengan arah intensional, setiap objek yang dikaji diberi nilai diagnostik bebas ke tahap yang lebih besar atau lebih kecil. Pada teras mereka, kaedah ini hampir dengan pendekatan klinikal, yang menganggap orang bukan sebagai rantaian objek yang disusun mengikut satu atau penunjuk lain, tetapi sebagai sistem integral, setiap satunya adalah individu dan mempunyai nilai diagnostik khas. Sikap berhati-hati terhadap objek kajian tidak membenarkan seseorang untuk mengecualikan atau kehilangan maklumat tentang setiap objek individu, yang berlaku apabila menggunakan kaedah arah yang disengajakan, menggunakan objek hanya untuk mengesan dan membetulkan corak tingkah laku sifat mereka.

Operasi utama dalam pengecaman corak menggunakan kaedah yang dibincangkan ialah operasi menentukan persamaan dan perbezaan objek. Objek dalam kumpulan kaedah yang ditentukan memainkan peranan sebagai preseden diagnostik. Pada masa yang sama, bergantung pada syarat tugas tertentu, peranan preseden individu boleh berbeza-beza dalam had yang paling luas: daripada penyertaan utama dan penentu kepada penyertaan tidak langsung dalam proses pengiktirafan. Sebaliknya, keadaan masalah mungkin memerlukan penyertaan bilangan preseden diagnostik yang berbeza untuk penyelesaian yang berjaya: daripada satu dalam setiap kelas yang boleh dikenali kepada saiz sampel penuh, serta cara yang berbeza untuk mengira ukuran persamaan dan perbezaan objek. Keperluan ini menerangkan pembahagian selanjutnya kaedah lanjutan kepada subkelas.

Kaedah perbandingan prototaip

Ini ialah kaedah pengecaman lanjutan yang paling mudah. Ia digunakan, sebagai contoh, dalam kes apabila kelas yang diiktiraf dipaparkan dalam ruang ciri oleh kumpulan geometri padat. Dalam kes ini, pusat kumpulan geometri kelas (atau objek yang paling hampir dengan pusat) biasanya dipilih sebagai titik prototaip.

Untuk mengklasifikasikan objek yang tidak diketahui, prototaip yang paling hampir dengannya ditemui, dan objek itu tergolong dalam kelas yang sama dengan prototaip ini. Jelas sekali, tiada imej kelas umum terbentuk dalam kaedah ini.

Pelbagai jenis jarak boleh digunakan sebagai ukuran kedekatan. Selalunya untuk ciri dikotomi, jarak Hamming digunakan, yang dalam kes ini adalah sama dengan kuasa dua jarak Euclidean. Dalam kes ini, peraturan keputusan untuk mengelaskan objek adalah bersamaan dengan fungsi keputusan linear.

Fakta ini perlu diberi perhatian khusus. Ia jelas menunjukkan hubungan antara prototaip dan perwakilan indikatif maklumat tentang struktur data. Menggunakan perwakilan di atas, sebagai contoh, sebarang skala pengukur tradisional, yang merupakan fungsi linear bagi nilai ciri dikotomi, boleh dianggap sebagai prototaip diagnostik hipotesis. Sebaliknya, jika analisis struktur spatial kelas yang diiktiraf membolehkan kita membuat kesimpulan bahawa ia adalah padat secara geometri, maka sudah cukup untuk menggantikan setiap kelas ini dengan satu prototaip, yang sebenarnya bersamaan dengan model diagnostik linear.

Dalam amalan, sudah tentu, keadaan sering berbeza daripada contoh ideal yang diterangkan. Seorang penyelidik yang berhasrat untuk menggunakan kaedah pengecaman berdasarkan perbandingan dengan prototaip kelas diagnostik menghadapi masalah yang sukar.

Pertama, ia adalah pilihan ukuran kedekatan (metrik), yang boleh mengubah konfigurasi spatial taburan objek dengan ketara. Kedua, masalah bebas ialah analisis struktur multidimensi data eksperimen. Kedua-dua masalah ini amat akut bagi penyelidik di bawah keadaan ruang ciri berdimensi tinggi, yang tipikal untuk masalah sebenar.

k kaedah jiran terdekat

Kaedah k tetangga terdekat untuk menyelesaikan masalah analisis diskriminasi pertama kali dicadangkan pada tahun 1952. Ia adalah seperti berikut.

Apabila mengelaskan objek yang tidak diketahui, nombor tertentu (k) objek lain yang paling hampir secara geometri dengannya dalam ruang ciri (jiran terdekat) yang sudah diketahui tergolong dalam kelas yang boleh dikenali ditemui. Keputusan untuk menetapkan objek yang tidak diketahui kepada kelas diagnostik tertentu dibuat dengan menganalisis maklumat tentang keahlian diketahui jiran terdekatnya, sebagai contoh, menggunakan kiraan undi yang mudah.

Pada mulanya, kaedah k jiran terdekat dianggap sebagai kaedah bukan parametrik untuk menganggar nisbah kemungkinan. Untuk kaedah ini, anggaran teori keberkesanannya diperolehi berbanding dengan pengelas Bayesian yang optimum. Dibuktikan bahawa kebarangkalian ralat asimptotik untuk kaedah jiran terdekat k melebihi ralat peraturan Bayes tidak lebih daripada dua kali.

Apabila menggunakan kaedah k neighbors terdekat untuk pengecaman corak, penyelidik perlu menyelesaikan masalah sukar memilih metrik untuk menentukan kedekatan objek yang didiagnosis. Masalah ini dalam keadaan dimensi tinggi ruang ciri menjadi sangat teruk disebabkan kerumitan kaedah ini yang mencukupi, yang menjadi ketara walaupun untuk komputer berprestasi tinggi. Oleh itu, di sini, seperti dalam kaedah perbandingan prototaip, adalah perlu untuk menyelesaikan masalah kreatif menganalisis struktur multidimensi data eksperimen untuk meminimumkan bilangan objek yang mewakili kelas diagnostik.

Keperluan untuk mengurangkan bilangan objek dalam sampel latihan (pendahuluan diagnostik) adalah kelemahan kaedah ini, kerana ia mengurangkan keterwakilan sampel latihan.

Algoritma untuk mengira markah ("mengundi")

Prinsip operasi algoritma penilaian (ABO) adalah untuk mengira keutamaan (skor persamaan) yang mencirikan "kehampiran" objek yang diiktiraf dan rujukan mengikut sistem ensembel ciri, yang merupakan sistem subset bagi set ciri tertentu. .

Tidak seperti semua kaedah yang dipertimbangkan sebelum ini, algoritma untuk mengira anggaran beroperasi dengan penerangan objek dengan cara yang asasnya baharu. Untuk algoritma ini, objek wujud serentak dalam subruang yang sangat berbeza bagi ruang ciri. Kelas ABO membawa idea menggunakan ciri kepada kesimpulan logiknya: kerana tidak selalu diketahui gabungan ciri mana yang paling bermaklumat, dalam ABO tahap persamaan objek dikira dengan membandingkan semua gabungan ciri yang mungkin atau tertentu. termasuk dalam huraian objek.

Gabungan atribut (subruang) yang digunakan dipanggil set sokongan atau set perihalan separa objek. Konsep kedekatan umum antara objek yang dikenali dan objek sampel latihan (dengan klasifikasi yang diketahui), yang dipanggil objek rujukan, diperkenalkan. Kehampiran ini diwakili oleh gabungan kedekatan objek yang dikenali dengan objek rujukan yang dikira pada set perihalan separa. Oleh itu, ABO ialah lanjutan daripada kaedah jiran terdekat k, di mana kedekatan objek dianggap hanya dalam satu ruang ciri tertentu.

Satu lagi lanjutan ABO adalah bahawa dalam algoritma ini masalah menentukan persamaan dan perbezaan objek dirumuskan sebagai satu parametrik dan peringkat penalaan ABO pada sampel latihan dipilih, di mana nilai optimum yang dimasukkan parameter dipilih. Kriteria kualiti ialah ralat pengecaman, dan secara literal semuanya diparameterkan:

  • peraturan untuk mengira jarak objek dengan ciri individu;
  • peraturan untuk mengira jarak objek dalam subruang ciri;
  • tahap kepentingan objek rujukan tertentu sebagai preseden diagnostik;
  • kepentingan sumbangan setiap set rujukan ciri kepada penilaian akhir kesamaan objek yang diiktiraf dengan mana-mana kelas diagnostik.

Parameter penyejuk udara ditetapkan dalam bentuk nilai ambang dan (atau) sebagai berat komponen yang ditentukan.

Kemungkinan teori ABO sekurang-kurangnya tidak lebih rendah daripada algoritma pengecaman corak lain, kerana dengan bantuan ABO semua operasi yang boleh difikirkan dengan objek yang dikaji boleh dilaksanakan.

Tetapi, seperti yang biasa berlaku, pengembangan potensi menghadapi kesukaran yang besar dalam pelaksanaan praktikalnya, terutamanya pada peringkat membina (penalaan) algoritma jenis ini.

Kesukaran yang berasingan telah dinyatakan sebelum ini apabila membincangkan kaedah k jiran terdekat, yang boleh ditafsirkan sebagai versi ABO yang dipotong. Ia juga boleh dipertimbangkan dalam bentuk parametrik dan mengurangkan masalah untuk mencari metrik wajaran jenis yang dipilih. Pada masa yang sama, persoalan teori yang kompleks dan masalah yang berkaitan dengan organisasi proses pengiraan yang cekap sudah timbul di sini untuk masalah dimensi tinggi.

Untuk ABO, jika anda cuba menggunakan keupayaan algoritma ini sepenuhnya, kesukaran ini meningkat berkali-kali ganda.

Masalah yang dinyatakan menjelaskan hakikat bahawa dalam amalan penggunaan ABO untuk menyelesaikan masalah dimensi tinggi disertai dengan pengenalan sebarang sekatan dan andaian heuristik. Khususnya, terdapat contoh penggunaan ABO dalam psikodiagnostik, di mana versi ABO telah diuji, yang sebenarnya bersamaan dengan kaedah k jiran terdekat.

Kolektif Peraturan Penentu

Pada akhir semakan kaedah pengecaman corak, mari kita memikirkan satu lagi pendekatan. Ini adalah apa yang dipanggil pasukan peraturan keputusan (CRC).

Memandangkan algoritma pengecaman yang berbeza berkelakuan berbeza pada sampel objek yang sama, persoalan secara semula jadi timbul mengenai peraturan keputusan sintetik yang secara adaptif menggunakan kekuatan algoritma ini. Peraturan keputusan sintetik menggunakan skim pengecaman dua peringkat. Pada peringkat pertama, algoritma pengecaman peribadi berfungsi, hasilnya digabungkan pada tahap kedua dalam blok sintesis. Kaedah yang paling biasa bagi gabungan sedemikian adalah berdasarkan peruntukan bidang kecekapan algoritma tertentu. Cara paling mudah untuk mencari bidang kecekapan adalah dengan membahagikan ruang ciri secara priori berdasarkan pertimbangan profesional sains tertentu (contohnya, stratifikasi sampel mengikut beberapa ciri). Kemudian, untuk setiap kawasan yang dipilih, algoritma pengecamannya sendiri dibina. Kaedah lain adalah berdasarkan penggunaan analisis formal untuk menentukan kawasan tempatan ruang ciri sebagai kejiranan objek yang boleh dikenali yang mana kejayaan algoritma pengecaman tertentu telah terbukti.

Pendekatan paling umum untuk membina blok sintesis menganggap penunjuk yang terhasil bagi algoritma tertentu sebagai ciri awal untuk membina peraturan keputusan umum yang baharu. Dalam kes ini, semua kaedah arah intensional dan lanjutan di atas dalam pengecaman corak boleh digunakan. Berkesan untuk menyelesaikan masalah mencipta satu set peraturan keputusan adalah algoritma logik jenis "Kora" dan algoritma untuk mengira anggaran (ABO), yang membentuk asas kepada pendekatan algebra yang dipanggil, yang menyediakan penyelidikan dan penerangan yang membina algoritma pengecaman, di mana semua jenis algoritma sedia ada sesuai.

Analisis perbandingan kaedah pengecaman corak

Mari kita bandingkan kaedah pengecaman corak yang diterangkan di atas dan menilai tahap kecukupan mereka kepada keperluan yang dirumuskan dalam Bahagian 3.3.3 untuk model SDA untuk sistem kawalan automatik penyesuaian untuk sistem yang kompleks.

Untuk menyelesaikan masalah sebenar daripada kumpulan kaedah arah intensi, kaedah dan kaedah parametrik berdasarkan cadangan dalam bentuk fungsi penentu adalah bernilai praktikal. Kaedah parametrik membentuk asas metodologi tradisional untuk membina penunjuk. Penggunaan kaedah ini dalam masalah sebenar dikaitkan dengan pengenaan sekatan yang kuat pada struktur data, yang membawa kepada model diagnostik linear dengan anggaran yang sangat anggaran parameternya. Apabila menggunakan kaedah berdasarkan andaian tentang bentuk fungsi keputusan, penyelidik juga terpaksa beralih kepada model linear. Ini disebabkan oleh dimensi ruang ciri yang tinggi, yang tipikal untuk masalah sebenar, yang, dengan peningkatan dalam tahap fungsi keputusan polinomial, memberikan peningkatan yang besar dalam bilangan ahlinya dengan peningkatan bersamaan yang bermasalah dalam kualiti pengiktirafan. Oleh itu, dengan memproyeksikan kawasan potensi penggunaan kaedah pengecaman intensiti kepada masalah sebenar, kami mendapat gambaran yang sepadan dengan metodologi tradisional model diagnostik linear yang mantap.

Sifat model diagnostik linear, di mana penunjuk diagnostik diwakili oleh jumlah wajaran ciri awal, dikaji dengan baik. Keputusan model ini (dengan normalisasi yang sesuai) ditafsirkan sebagai jarak dari objek yang dikaji ke beberapa hyperplane dalam ruang ciri atau, secara bersamaan, sebagai unjuran objek ke beberapa garis lurus dalam ruang yang diberikan. Oleh itu, model linear hanya memadai untuk konfigurasi geometri mudah bagi kawasan ruang ciri di mana objek kelas diagnostik yang berbeza dipetakan. Dengan pengedaran yang lebih kompleks, model ini pada asasnya tidak dapat menggambarkan banyak ciri struktur data percubaan. Pada masa yang sama, ciri sedemikian boleh memberikan maklumat diagnostik yang berharga.

Pada masa yang sama, penampilan dalam sebarang masalah sebenar struktur multidimensi mudah (khususnya, taburan normal multidimensi) harus dianggap sebagai pengecualian dan bukannya sebagai peraturan. Selalunya, kelas diagnostik dibentuk berdasarkan kriteria luaran yang kompleks, yang secara automatik melibatkan heterogeniti geometri kelas ini dalam ruang ciri. Ini adalah benar terutamanya untuk kriteria "kehidupan" yang paling kerap ditemui dalam amalan. Di bawah keadaan sedemikian, penggunaan model linear hanya menangkap corak maklumat eksperimen yang paling "kasar".

Penggunaan kaedah lanjutan tidak dikaitkan dengan sebarang andaian tentang struktur maklumat eksperimen, kecuali dalam kelas yang diiktiraf mesti ada satu atau lebih kumpulan objek yang agak serupa, dan objek kelas yang berbeza mesti berbeza antara satu sama lain dalam beberapa cara. Adalah jelas bahawa untuk mana-mana dimensi terhingga sampel latihan (dan ia tidak boleh berbeza), keperluan ini sentiasa dipenuhi semata-mata kerana terdapat perbezaan rawak antara objek. Pelbagai ukuran kedekatan (jarak) objek dalam ruang ciri digunakan sebagai ukuran persamaan. Oleh itu, penggunaan kaedah pengecaman corak sambungan yang berkesan bergantung pada sejauh mana ukuran kedekatan ini ditakrifkan, serta pada objek sampel latihan yang mana (objek dengan klasifikasi yang diketahui) memainkan peranan sebagai preseden diagnostik. Penyelesaian yang berjaya bagi masalah ini memberikan hasil yang menghampiri had kecekapan pengecaman yang boleh dicapai secara teori.

Kelebihan kaedah lanjutan pengecaman corak ditentang, pertama sekali, oleh kerumitan teknikal yang tinggi dalam pelaksanaan praktikalnya. Untuk ruang ciri berdimensi tinggi, tugas yang kelihatan mudah untuk mencari pasangan mata terdekat bertukar menjadi masalah yang serius. Juga, ramai pengarang mencatatkan sebagai masalah keperluan untuk mengingati bilangan objek yang cukup besar yang mewakili kelas yang boleh dikenali.

Dengan sendirinya, ini bukan masalah, tetapi ia dianggap sebagai masalah (contohnya, dalam kaedah k jiran terdekat) atas sebab apabila mengenali setiap objek, penghitungan lengkap semua objek dalam sampel latihan berlaku.

Oleh itu, adalah dinasihatkan untuk menggunakan model sistem pengecaman, di mana masalah penghitungan lengkap objek sampel latihan semasa pengecaman dikeluarkan, kerana ia dijalankan hanya sekali apabila membentuk imej umum kelas pengecaman. Dalam pengiktirafan itu sendiri, objek yang dikenal pasti dibandingkan hanya dengan imej umum kelas pengecaman, bilangannya tetap dan tidak bergantung sama sekali pada dimensi sampel latihan. Pendekatan ini membolehkan anda meningkatkan dimensi sampel latihan sehingga kualiti tinggi imej umum yang diperlukan dicapai, tanpa sebarang kebimbangan bahawa ini boleh membawa kepada peningkatan yang tidak boleh diterima dalam masa pengecaman (kerana masa pengecaman dalam model ini tidak bergantung pada dimensi latihan sama sekali). sampel).

Masalah teori menggunakan kaedah pengecaman lanjutan adalah berkaitan dengan masalah mencari kumpulan ciri bermaklumat, mencari metrik optimum untuk mengukur persamaan dan perbezaan objek, dan menganalisis struktur maklumat eksperimen. Pada masa yang sama, penyelesaian yang berjaya bagi masalah ini membolehkan bukan sahaja mereka bentuk algoritma pengecaman yang berkesan, tetapi juga membuat peralihan daripada pengetahuan lanjutan fakta empirikal kepada pengetahuan intensif tentang corak strukturnya.

Peralihan daripada pengetahuan lanjutan kepada pengetahuan intensional berlaku pada peringkat apabila algoritma pengecaman formal telah pun dibina dan keberkesanannya telah ditunjukkan. Kemudian kajian tentang mekanisme di mana kecekapan yang diperolehi dicapai dijalankan. Kajian sedemikian, yang dikaitkan dengan analisis struktur geometri data, boleh, sebagai contoh, membawa kepada kesimpulan bahawa sudah cukup untuk menggantikan objek yang mewakili kelas diagnostik tertentu dengan satu wakil tipikal (prototaip). Ini bersamaan, seperti yang dinyatakan di atas, dengan menetapkan skala diagnostik linear tradisional. Ia juga mungkin cukup untuk menggantikan setiap kelas diagnostik dengan beberapa objek yang bermakna sebagai wakil tipikal beberapa subkelas, yang bersamaan dengan membina peminat skala linear. Terdapat pilihan lain, yang akan dibincangkan di bawah.

Oleh itu, kajian semula kaedah pengecaman menunjukkan bahawa beberapa kaedah pengecaman corak yang berbeza telah dibangunkan secara teorinya pada masa ini. Sastera menyediakan klasifikasi terperinci mengenainya. Walau bagaimanapun, untuk kebanyakan kaedah ini, pelaksanaan perisian mereka tidak ada, dan ini adalah sangat semula jadi, seseorang mungkin mengatakan "ditetapkan" oleh ciri-ciri kaedah pengecaman itu sendiri. Ini boleh dinilai oleh fakta bahawa sistem sedemikian tidak banyak disebut dalam kesusasteraan khusus dan sumber maklumat lain.

Akibatnya, persoalan tentang kebolehgunaan praktikal kaedah pengecaman teori tertentu untuk menyelesaikan masalah praktikal dengan dimensi data sebenar (iaitu, agak ketara) dan pada komputer moden sebenar masih tidak dibangunkan dengan mencukupi.

Keadaan di atas boleh difahami jika kita ingat bahawa kerumitan model matematik secara eksponen meningkatkan kerumitan pelaksanaan perisian sistem dan pada tahap yang sama mengurangkan kemungkinan bahawa sistem ini akan benar-benar berfungsi. Ini bermakna hanya sistem perisian berdasarkan model matematik yang agak mudah dan "telus" boleh dilaksanakan di pasaran. Oleh itu, pembangun yang berminat untuk mereplikasi produk perisiannya mendekati isu memilih model matematik bukan dari sudut pandangan saintifik semata-mata, tetapi sebagai seorang pragmatis, dengan mengambil kira kemungkinan pelaksanaan perisian. Beliau percaya bahawa model itu harus semudah mungkin, yang bermaksud ia harus dilaksanakan pada kos yang lebih rendah dan dengan kualiti yang lebih baik, dan ia juga harus berfungsi (secara praktikal berkesan).

Dalam hal ini, tugas melaksanakan dalam sistem pengecaman mekanisme untuk menyamaratakan perihalan objek kepunyaan kelas yang sama, i.e. mekanisme untuk pembentukan imej umum padat. Adalah jelas bahawa mekanisme generalisasi sedemikian akan membolehkan "memampatkan" mana-mana sampel latihan dari segi dimensi kepada asas imej umum yang diketahui terlebih dahulu dari segi dimensi. Ini juga akan membolehkan kami menetapkan dan menyelesaikan beberapa masalah yang tidak boleh dirumuskan dalam kaedah pengecaman seperti perbandingan dengan kaedah prototaip, kaedah k jiran terdekat, dan ABO.

Ini adalah tugas-tugas:

  • menentukan sumbangan maklumat ciri kepada potret maklumat imej umum;
  • analisis kluster-konstruktif imej umum;
  • penentuan beban semantik ciri;
  • analisis ciri kluster-konstruktif semantik;
  • perbandingan bermakna bagi imej kelas umum antara satu sama lain dan ciri antara satu sama lain (rajah kognitif, termasuk rajah Merlin).

Kaedah yang memungkinkan untuk mencapai penyelesaian masalah ini juga membezakan sistem perspektif berdasarkannya daripada sistem lain, sama seperti penyusun berbeza daripada penterjemah, kerana disebabkan pembentukan imej umum dalam sistem perspektif ini, masa pengecaman adalah bebas daripada saiz sampel latihan. Adalah diketahui bahawa kewujudan pergantungan ini yang membawa kepada perbelanjaan masa komputer yang boleh diterima secara praktikal untuk pengiktirafan dalam kaedah seperti kaedah k jiran terdekat, ABO, dan CRP pada dimensi sampel latihan sedemikian, apabila seseorang boleh bercakap tentang mencukupi. perangkaan.

Sebagai kesimpulan kajian ringkas kaedah pengecaman, kami membentangkan intipati perkara di atas dalam jadual ringkasan (Jadual 3.1), yang mengandungi penerangan ringkas tentang pelbagai kaedah pengecaman corak dalam parameter berikut:

  • klasifikasi kaedah pengiktirafan;
  • bidang penggunaan kaedah pengiktirafan;
  • klasifikasi had kaedah pengecaman.
Klasifikasi kaedah pengecaman Kawasan permohonan Had (kelemahan)
Kaedah pengecaman intensif Kaedah berdasarkan anggaran kepadatan taburan nilai ciri (atau persamaan dan perbezaan antara objek) Masalah dengan pengedaran yang diketahui, biasanya normal, keperluan untuk mengumpul statistik yang besar Keperluan untuk menghitung keseluruhan set latihan semasa pengiktirafan, kepekaan yang tinggi terhadap ketakwakilan set latihan dan artifak
Kaedah berdasarkan andaian tentang kelas fungsi keputusan Kelas hendaklah boleh dipisahkan dengan baik, sistem ciri hendaklah ortonormal Bentuk fungsi keputusan mesti diketahui terlebih dahulu. Kemustahilan untuk mengambil kira pengetahuan baru tentang korelasi antara ciri
Kaedah Boolean Apabila memilih peraturan keputusan logik (kata hubung), penghitungan yang lengkap diperlukan. Kerumitan pengiraan yang tinggi
Kaedah linguistik (struktural). Masalah dimensi kecil ruang ciri Tugas memulihkan (mendefinisikan) tatabahasa daripada set pernyataan tertentu (keterangan objek) sukar untuk diformalkan. Masalah teori yang tidak dapat diselesaikan
Kaedah pengiktirafan lanjutan Kaedah perbandingan prototaip Masalah dimensi kecil ruang ciri Kebergantungan tinggi keputusan klasifikasi pada ukuran jarak (metrik). Ketidakpastian metrik optimum
k kaedah jiran terdekat Kebergantungan tinggi keputusan klasifikasi pada ukuran jarak (metrik). Keperluan untuk penghitungan lengkap sampel latihan semasa pengiktirafan. Kerumitan pengiraan
Algoritma untuk mengira markah (mengundi) AVO Masalah dimensi kecil dari segi bilangan kelas dan ciri Kebergantungan keputusan klasifikasi pada ukuran jarak (metrik). Keperluan untuk penghitungan lengkap sampel latihan semasa pengiktirafan. Kerumitan teknikal kaedah yang tinggi
Kolektif Peraturan Penentu (CRC) Masalah dimensi kecil dari segi bilangan kelas dan ciri Kerumitan teknikal kaedah yang sangat tinggi, bilangan masalah teori yang tidak dapat diselesaikan, baik dalam menentukan bidang kecekapan kaedah tertentu, dan dalam kaedah tertentu itu sendiri

Jadual 3.1 - Jadual ringkasan klasifikasi kaedah pengecaman, perbandingan bidang aplikasi dan hadnya

Peranan dan tempat pengecaman corak dalam automasi pengurusan sistem yang kompleks

Sistem kawalan automatik terdiri daripada dua bahagian utama: objek kawalan dan sistem kawalan.

Sistem kawalan melaksanakan fungsi berikut:

  • pengenalpastian keadaan objek kawalan;
  • pembangunan tindakan kawalan berdasarkan matlamat pengurusan, dengan mengambil kira keadaan objek kawalan dan persekitaran;
  • memberikan kesan kawalan pada objek kawalan.

Pengecaman corak tidak lebih daripada pengenalpastian keadaan sesuatu objek.

Oleh itu, kemungkinan menggunakan sistem pengecaman corak pada peringkat mengenal pasti keadaan objek kawalan kelihatan agak jelas dan semula jadi. Walau bagaimanapun, ini mungkin tidak perlu. Oleh itu, persoalan timbul dalam kes mana adalah dinasihatkan untuk menggunakan sistem pengecaman dalam sistem kawalan automatik, dan di mana ia tidak.

Menurut kesusasteraan, dalam banyak sistem kawalan automatik yang dibangunkan sebelum ini dan moden, dalam subsistem untuk mengenal pasti keadaan objek kawalan dan menjana tindakan kawalan, model matematik deterministik "pengiraan langsung" digunakan, yang dengan jelas dan agak mudah menentukan apa yang perlu lakukan dengan objek kawalan jika ia mempunyai parameter luaran tertentu.

Pada masa yang sama, persoalan bagaimana parameter ini berkaitan dengan keadaan tertentu objek kawalan tidak dibangkitkan atau diselesaikan. Kedudukan ini sepadan dengan sudut pandangan, yang terdiri daripada fakta bahawa hubungan satu dengan satu mereka diterima "secara lalai". Oleh itu, istilah: "parameter objek kawalan" dan "keadaan objek kawalan" dianggap sebagai sinonim, dan konsep "keadaan objek kawalan" tidak diperkenalkan secara eksplisit sama sekali. Walau bagaimanapun, adalah jelas bahawa, dalam kes umum, hubungan antara parameter yang diperhatikan bagi objek kawalan dan keadaannya adalah dinamik dan kebarangkalian.

Oleh itu, sistem kawalan automatik tradisional pada asasnya adalah sistem kawalan parametrik, i.e. sistem yang menguruskan bukan keadaan objek kawalan, tetapi hanya parameter yang boleh diperhatikan. Keputusan mengenai tindakan kawalan diambil dalam sistem sedemikian seolah-olah "membuta tuli", i.e. tanpa membentuk imej holistik objek kawalan dan persekitaran dalam keadaan semasa mereka, serta tanpa meramalkan perkembangan persekitaran dan tindak balas objek kawalan terhadap tindakan kawalan tertentu ke atasnya, bertindak serentak dengan pengaruh persekitaran yang diramalkan. .

Daripada jawatan yang dibangunkan dalam kertas ini, istilah "membuat keputusan" dalam erti kata moden hampir tidak boleh digunakan untuk sistem kawalan automatik tradisional. Hakikatnya ialah "membuat keputusan", sekurang-kurangnya, melibatkan visi holistik objek dalam persekitaran, dan bukan sahaja dalam keadaan semasa mereka, tetapi juga dalam dinamik, dan dalam interaksi antara satu sama lain dan dengan sistem kawalan, melibatkan pertimbangan pelbagai pilihan alternatif untuk pembangunan keseluruhan sistem ini, serta penyempitan kepelbagaian (pengurangan) alternatif ini berdasarkan kriteria sasaran tertentu. Tiada satu pun daripada ini, jelas, bukan dalam ACS tradisional, atau ia, tetapi dalam bentuk yang dipermudahkan.

Sudah tentu, kaedah tradisional adalah mencukupi dan penggunaannya agak betul dan wajar dalam kes di mana objek kawalan sememangnya sistem yang stabil dan ditentukan secara tegar, dan pengaruh persekitaran ke atasnya boleh diabaikan.

Walau bagaimanapun, dalam kes lain kaedah ini tidak berkesan.

Jika objek kawalan adalah dinamik, maka model yang mendasari algoritma kawalannya dengan cepat menjadi tidak mencukupi, kerana hubungan antara parameter input dan output berubah, serta set parameter penting itu sendiri. Pada dasarnya, ini bermakna bahawa sistem kawalan automatik tradisional dapat mengawal keadaan objek kawalan hanya berhampiran titik keseimbangan dengan cara tindakan kawalan yang lemah padanya, i.e. dengan kaedah gangguan kecil. Jauh dari keadaan keseimbangan, dari sudut pandangan tradisional, tingkah laku objek kawalan kelihatan tidak dapat diramalkan dan tidak terkawal.

Jika tidak ada hubungan yang jelas antara parameter input dan output objek kawalan (iaitu, antara parameter input dan keadaan objek), dengan kata lain, jika hubungan ini mempunyai sifat kebarangkalian yang jelas, maka model deterministik, dalam yang diandaikan bahawa hasil pengukuran parameter tertentu hanyalah nombor, pada mulanya tidak berkenaan. Di samping itu, bentuk hubungan ini mungkin tidak diketahui, dan kemudian adalah perlu untuk meneruskan dari andaian yang paling umum: bahawa ia adalah kebarangkalian, atau tidak ditakrifkan sama sekali.

Sistem kawalan automatik yang dibina berdasarkan prinsip tradisional hanya boleh berfungsi berdasarkan parameter, corak hubungan yang telah diketahui, dikaji dan dicerminkan dalam model matematik, dalam kajian ini tugas telah ditetapkan untuk membangunkan kaedah sedemikian untuk mereka bentuk kawalan automatik sistem yang akan membolehkan mencipta sistem yang boleh mengenal pasti dan menetapkan parameter yang paling penting, dan menentukan sifat pautan antara mereka dan keadaan objek kawalan.

Dalam kes ini, adalah perlu untuk menggunakan kaedah pengukuran yang lebih maju dan mencukupi kepada situasi sebenar:

  • pengelasan atau pengecaman corak (pembelajaran berdasarkan sampel latihan, kebolehsuaian algoritma pengecaman, kebolehsuaian set kelas dan parameter yang dikaji, pemilihan parameter yang paling penting dan pengurangan dimensi perihalan sambil mengekalkan redundansi yang diberikan, dsb.);
  • pengukuran statistik, apabila hasil pengukuran parameter tertentu bukan nombor tunggal, tetapi taburan kebarangkalian: perubahan dalam pembolehubah statistik tidak bermakna perubahan dalam nilainya sendiri, tetapi perubahan dalam ciri-ciri taburan kebarangkalian nilai-nilainya.

Akibatnya, sistem kawalan automatik berdasarkan pendekatan deterministik tradisional secara praktikalnya tidak berfungsi dengan objek kawalan deterministik lemah berbilang parametrik dinamik kompleks, seperti, sebagai contoh, sistem makro dan mikro-sosio-ekonomi dalam ekonomi dinamik " tempoh peralihan”, kumpulan elit dan etnik berhierarki, masyarakat dan pengundi, fisiologi dan jiwa manusia, ekosistem semula jadi dan buatan dan lain-lain lagi.

Adalah sangat penting bahawa pada pertengahan tahun 80-an, sekolah I.Prigozhin mengembangkan pendekatan, mengikut mana dalam pembangunan mana-mana sistem (termasuk seseorang), tempoh bergantian di mana sistem berkelakuan sama ada sebagai "kebanyakan deterministik", atau sebagai "kebanyakannya rawak." Sememangnya, sistem kawalan sebenar mesti menguruskan objek kawalan secara stabil bukan sahaja pada bahagian "deterministik" dalam sejarahnya, tetapi juga pada titik apabila kelakuan selanjutnya menjadi sangat tidak pasti. Ini sahaja bermakna bahawa adalah perlu untuk membangunkan pendekatan kepada pengurusan sistem dalam tingkah laku yang terdapat unsur rawak yang besar (atau yang pada masa ini digambarkan secara matematik sebagai "rawak").

Oleh itu, komposisi sistem kawalan automatik yang menjanjikan yang menyediakan kawalan sistem penentuan lemah berbilang parameter dinamik kompleks, sebagai pautan berfungsi penting, nampaknya akan merangkumi subsistem untuk mengenal pasti dan meramalkan keadaan persekitaran dan objek kawalan, berdasarkan kaedah. kecerdasan buatan(terutamanya pengecaman corak), kaedah sokongan keputusan dan teori maklumat.

Mari kita pertimbangkan secara ringkas isu menggunakan sistem pengecaman imej untuk membuat keputusan mengenai tindakan kawalan (isu ini akan dibincangkan dengan lebih terperinci kemudian, kerana ia adalah kunci untuk kerja ini). Jika kita mengambil sasaran dan keadaan lain objek kawalan sebagai kelas pengecaman, dan faktor yang mempengaruhinya sebagai tanda, maka ukuran hubungan antara faktor dan keadaan boleh dibentuk dalam model pengecaman corak. Ini membolehkan mendapatkan maklumat tentang faktor yang menyumbang kepada atau menghalang peralihannya kepada keadaan ini, berdasarkan keadaan objek kawalan tertentu, dan, atas dasar ini, membangunkan keputusan mengenai tindakan kawalan.

Faktor boleh dibahagikan kepada kumpulan berikut:

  • mencirikan prasejarah objek kawalan;
  • mencirikan keadaan semasa objek kawalan;
  • faktor persekitaran;
  • faktor teknologi (terurus).

Oleh itu, sistem pengecaman imej boleh digunakan sebagai sebahagian daripada sistem kawalan automatik: dalam subsistem untuk mengenal pasti keadaan objek kawalan dan menjana tindakan kawalan.

Ini berguna apabila objek kawalan adalah sistem yang kompleks.

Membuat keputusan mengenai tindakan kawalan dalam sistem kawalan automatik

Penyelesaian masalah sintesis sistem kawalan automatik adaptif oleh sistem kompleks dipertimbangkan dalam kertas ini, dengan mengambil kira analogi yang banyak dan mendalam antara kaedah pengecaman corak dan membuat keputusan.

Di satu pihak, tugas pengecaman corak ialah keputusan tentang kepunyaan objek yang boleh dikenali kepada kelas pengecaman tertentu.

Sebaliknya, penulis mencadangkan untuk menganggap masalah membuat keputusan sebagai masalah songsang penyahkodan atau masalah songsang pengecaman corak (lihat bahagian 2.2.2).

Kesamaan idea asas yang mendasari kaedah pengecaman corak dan membuat keputusan menjadi amat jelas apabila mempertimbangkannya dari sudut teori maklumat.

Pelbagai tugas membuat keputusan

Membuat keputusan sebagai merealisasikan matlamat

Definisi: membuat keputusan ("pilihan") ialah tindakan ke atas set alternatif, akibatnya set alternatif asal menyempit, i.e. ia dikurangkan.

Pilihan adalah tindakan yang memberikan tujuan kepada semua aktiviti. Ia adalah melalui tindakan pilihan bahawa subordinasi semua aktiviti kepada matlamat tertentu atau satu set matlamat yang saling berkaitan direalisasikan.

Oleh itu, agar tindakan pilihan menjadi mungkin, perkara berikut perlu:

  • penjanaan atau penemuan satu set alternatif untuk membuat pilihan;
  • penentuan matlamat untuk pencapaian yang pilihan dibuat;
  • pembangunan dan aplikasi kaedah untuk membandingkan alternatif antara satu sama lain, i.e. menentukan penilaian keutamaan bagi setiap alternatif mengikut kriteria tertentu, membolehkan secara tidak langsung menilai bagaimana setiap alternatif memenuhi matlamat.

Kerja moden dalam bidang sokongan keputusan telah mendedahkan situasi ciri, yang terdiri daripada fakta bahawa pemformalan lengkap mencari penyelesaian terbaik (dalam erti kata tertentu) hanya mungkin untuk masalah yang dipelajari dengan baik, agak mudah, sementara dalam praktiknya, masalah berstruktur lemah adalah lebih biasa, yang mana algoritma yang diformalkan sepenuhnya belum dibangunkan (kecuali untuk penghitungan menyeluruh dan percubaan dan kesilapan). Walau bagaimanapun, profesional yang berpengalaman, cekap dan berkebolehan sering membuat pilihan yang ternyata agak baik. Oleh itu, trend semasa dalam amalan membuat keputusan dalam situasi semula jadi adalah untuk menggabungkan keupayaan seseorang untuk menyelesaikan masalah tidak formal dengan keupayaan kaedah formal dan pemodelan komputer: sistem sokongan keputusan interaktif, sistem pakar, mesin manusia adaptif automatik. sistem kawalan, rangkaian saraf dan sistem kognitif.

Membuat keputusan sebagai menghapuskan ketidakpastian (pendekatan maklumat)

Proses mendapatkan maklumat boleh dianggap sebagai penurunan ketidakpastian akibat menerima isyarat, dan jumlah maklumat sebagai ukuran kuantitatif tahap penyingkiran ketidakpastian.

Tetapi akibat memilih beberapa subset alternatif daripada set, i.e. akibat membuat keputusan, perkara yang sama berlaku (penurunan dalam ketidakpastian). Ini bermakna setiap pilihan, setiap keputusan menjana sejumlah maklumat, dan oleh itu boleh diterangkan dari segi teori maklumat.

Klasifikasi masalah membuat keputusan

Kepelbagaian tugas membuat keputusan adalah disebabkan oleh hakikat bahawa setiap komponen situasi di mana pembuatan keputusan dijalankan boleh dilaksanakan dalam pilihan yang berbeza secara kualitatif.

Berikut adalah beberapa pilihan ini:

  • set alternatif, dalam satu pihak, boleh menjadi terhingga, boleh dikira atau berterusan, dan sebaliknya, ia boleh ditutup (iaitu, diketahui sepenuhnya) atau terbuka (termasuk elemen yang tidak diketahui);
  • alternatif boleh dinilai mengikut satu atau lebih kriteria, yang seterusnya, boleh menjadi kuantitatif atau kualitatif;
  • mod pemilihan boleh menjadi tunggal (sekali), atau berbilang, berulang, termasuk maklum balas mengenai keputusan pemilihan, i.e. membenarkan pembelajaran algoritma membuat keputusan, dengan mengambil kira akibat pilihan raya sebelumnya;
  • akibat memilih setiap alternatif boleh diketahui dengan tepat lebih awal (pilihan di bawah kepastian), mempunyai sifat kebarangkalian apabila kebarangkalian hasil yang mungkin diketahui selepas pilihan dibuat (pilihan di bawah risiko) atau mempunyai hasil yang tidak jelas dengan kebarangkalian yang tidak diketahui (pilihan). di bawah ketidakpastian);
  • tanggungjawab untuk pilihan mungkin tidak hadir, individu atau kumpulan;
  • tahap konsistensi matlamat dalam pilihan kumpulan boleh berbeza-beza daripada kebetulan sepenuhnya kepentingan pihak-pihak (pilihan koperasi) kepada lawan mereka (pilihan dalam situasi konflik). Pilihan perantaraan juga mungkin: kompromi, gabungan, konflik yang semakin meningkat atau semakin pudar.

Pelbagai kombinasi pilihan ini membawa kepada banyak masalah membuat keputusan yang telah dikaji pada tahap yang berbeza-beza.

Bahasa untuk menerangkan kaedah membuat keputusan

Satu dan fenomena yang sama boleh dibicarakan dalam bahasa yang berbeza dengan tahap keluasan dan kecukupan yang berbeza-beza. Sehingga kini, terdapat tiga bahasa utama untuk menerangkan pilihan.

Yang paling mudah, paling maju dan paling popular ialah bahasa kriteria.

Bahasa kriteria

Nama bahasa ini dikaitkan dengan andaian asas bahawa setiap alternatif individu boleh dinilai dengan beberapa (satu) nombor tertentu, selepas itu perbandingan alternatif dikurangkan kepada perbandingan nombor yang sepadan.

Biarkan, sebagai contoh, (X) ialah satu set alternatif, dan x ialah beberapa alternatif yang pasti kepunyaan set ini: x∈X. Kemudian ia dianggap bahawa untuk semua x fungsi q(x) boleh diberikan, yang dipanggil kriteria (kriteria kualiti, fungsi objektif, fungsi keutamaan, fungsi utiliti, dll.), yang mempunyai sifat bahawa jika alternatif x 1 ialah lebih baik daripada x 2 (ditandakan: x 1 > x 2), kemudian q (x 1) > q (x 2).

Dalam kes ini, pilihan dikurangkan kepada mencari alternatif dengan nilai tertinggi bagi fungsi kriteria.

Walau bagaimanapun, dalam praktiknya, penggunaan hanya satu kriteria untuk membandingkan tahap keutamaan alternatif ternyata menjadi penyederhanaan yang tidak wajar, kerana pertimbangan alternatif yang lebih terperinci membawa kepada keperluan untuk menilai mereka bukan mengikut satu, tetapi mengikut banyak orang. kriteria yang boleh berbeza sifat dan berbeza secara kualitatif antara satu sama lain.

Sebagai contoh, apabila memilih jenis pesawat yang paling boleh diterima untuk penumpang dan organisasi operasi pada jenis laluan tertentu, perbandingan dilakukan secara serentak mengikut banyak kumpulan kriteria: teknikal, teknologi, ekonomi, sosial, ergonomik, dll.

Masalah multikriteria tidak mempunyai penyelesaian umum yang unik. Oleh itu, banyak cara dicadangkan untuk memberikan masalah multikriteria bentuk tertentu yang membolehkan penyelesaian umum tunggal. Sememangnya, penyelesaian ini secara amnya berbeza untuk kaedah yang berbeza. Oleh itu, mungkin perkara utama dalam menyelesaikan masalah multikriteria adalah justifikasi jenis perumusannya.

Pelbagai pilihan untuk memudahkan masalah pemilihan multikriteria digunakan. Mari kita senaraikan beberapa daripada mereka.

  1. Memaksimumkan bersyarat (bukan ekstrem global bagi kriteria kamiran yang ditemui, tetapi ekstrem tempatan bagi kriteria utama).
  2. Cari alternatif dengan sifat yang diberikan.
  3. Mencari set Pareto.
  4. Pengurangan masalah berbilang kriteria kepada satu kriteria dengan memperkenalkan kriteria kamiran.

Mari kita pertimbangkan dengan lebih terperinci rumusan rasmi kaedah mengurangkan masalah berbilang kriteria kepada satu kriteria.

Kami memperkenalkan kriteria kamiran q 0 (x) sebagai fungsi skalar bagi hujah vektor:

q 0 (x) = q 0 ((q 1 (x), q 2 (x), ..., q n (x)).

Kriteria integral memungkinkan untuk memesan alternatif dengan q 0 , dengan itu menyerlahkan yang terbaik (dalam pengertian kriteria ini). Bentuk fungsi q 0 ditentukan oleh seberapa khusus kita membayangkan sumbangan setiap kriteria kepada kriteria kamiran. Biasanya fungsi aditif dan multiplikatif digunakan:

q 0 = ∑a i ⋅q i /s i

1 - q 0 = ∏(1 - b i ⋅q i /s i)

Pekali yang saya sediakan:

  1. Ketiadaan dimensi atau dimensi tunggal nombor a i ⋅q i /s i (kriteria tertentu yang berbeza mungkin mempunyai dimensi yang berbeza, dan kemudian adalah mustahil untuk melaksanakan operasi aritmetik padanya dan mengurangkannya kepada kriteria kamiran).
  2. Normalisasi, i.e. peruntukan syarat: b i ⋅q i /s i<1.

Pekali a i dan b i mencerminkan sumbangan relatif kriteria q i tertentu kepada kriteria kamiran.

Jadi, dalam suasana berbilang kriteria, masalah membuat keputusan untuk memilih salah satu alternatif dikurangkan untuk memaksimumkan kriteria integral:

x * = arg max(q 0 (q 1 (x), q 2 (x), ..., q n (x)))

Masalah utama dalam rumusan multikriteria bagi masalah membuat keputusan adalah perlu untuk mencari bentuk analisis bagi pekali a i dan b i , yang akan memberikan sifat model berikut:

  • tahap kecukupan bidang subjek yang tinggi dan sudut pandangan pakar;
  • kesukaran pengiraan minimum dalam memaksimumkan kriteria kamiran, i.e. pengiraannya untuk alternatif yang berbeza;
  • kestabilan keputusan memaksimumkan kriteria integral daripada gangguan kecil data awal.
  • Kestabilan penyelesaian bermakna bahawa perubahan kecil dalam data awal harus membawa kepada perubahan kecil dalam nilai kriteria integral, dan, dengan itu, kepada perubahan kecil dalam keputusan yang dibuat. Oleh itu, jika data awal secara praktikalnya sama, maka keputusan harus dibuat sama ada sama atau sangat rapat.

Bahasa Pemilihan Perduaan Berjujukan

Bahasa perhubungan binari adalah generalisasi bahasa multikriteria dan berdasarkan fakta bahawa apabila kita menilai beberapa alternatif, penilaian ini sentiasa relatif, i.e. secara eksplisit atau lebih kerap secara tersirat, alternatif lain daripada set yang dikaji atau daripada populasi umum digunakan sebagai asas atau kerangka rujukan untuk perbandingan. Pemikiran manusia adalah berdasarkan pencarian dan analisis yang bertentangan (konstruk), jadi sentiasa lebih mudah bagi kita untuk memilih satu daripada dua pilihan yang bertentangan daripada satu pilihan daripada set yang besar dan tidak bercelaru.

Oleh itu, andaian utama bahasa ini bermuara kepada perkara berikut:

  • satu alternatif tidak dinilai, i.e. fungsi kriteria tidak diperkenalkan;
  • untuk setiap pasangan alternatif, ia boleh diwujudkan dalam beberapa cara bahawa salah satu daripada mereka lebih baik daripada yang lain, atau bahawa ia adalah setara atau tidak dapat dibandingkan;
  • hubungan keutamaan dalam mana-mana pasangan alternatif tidak bergantung pada alternatif lain yang dikemukakan untuk pilihan.

Terdapat pelbagai cara untuk menentukan hubungan binari: langsung, matriks, menggunakan graf keutamaan, kaedah bahagian, dsb.

Hubungan antara alternatif satu pasangan dinyatakan melalui konsep kesetaraan, susunan dan penguasaan.

Fungsi bahasa pilihan umum

Fungsi bahasa pilihan adalah berdasarkan teori set dan membolehkan seseorang beroperasi dengan pemetaan set kepada subsetnya sepadan dengan pilihan yang berbeza tanpa perlu menghitung elemen. Bahasa ini sangat umum dan berpotensi membenarkan sebarang pilihan untuk diterangkan. Walau bagaimanapun, radas matematik bagi fungsi pilihan umum pada masa ini hanya dibangunkan dan diuji terutamanya pada masalah yang telah diselesaikan menggunakan pendekatan kriteria atau binari.

pilihan kumpulan

Biar ada sekumpulan orang yang mempunyai hak untuk mengambil bahagian dalam membuat keputusan kolektif. Katakan kumpulan ini sedang mempertimbangkan beberapa set alternatif, dan setiap ahli kumpulan membuat pilihannya. Tugasnya adalah untuk membangunkan penyelesaian yang dengan cara tertentu menyelaraskan pilihan individu dan dalam erti kata tertentu menyatakan "pendapat umum" kumpulan, i.e. diambil sebagai pilihan kumpulan.

Sememangnya, keputusan kumpulan yang berbeza akan sepadan dengan prinsip yang berbeza untuk menyelaraskan keputusan individu.

Peraturan untuk menyelaraskan keputusan individu dalam pilihan kumpulan dipanggil peraturan pengundian. Yang paling biasa ialah "peraturan majoriti", di mana keputusan kumpulan diambil oleh alternatif yang menerima undian terbanyak.

Perlu difahami bahawa keputusan sedemikian hanya mencerminkan kelaziman sudut pandangan yang berbeza dalam kumpulan, dan bukan pilihan yang benar-benar optimum, yang mana tiada siapa boleh mengundi sama sekali. "Kebenaran tidak ditentukan dengan mengundi."

Di samping itu, terdapat apa yang dipanggil "paradoks pengundian", yang paling terkenal ialah paradoks Arrow.

Paradoks ini boleh membawa, dan kadangkala membawa, kepada ciri-ciri prosedur pengundian yang sangat tidak menyenangkan: contohnya, terdapat kes apabila kumpulan itu tidak boleh membuat satu keputusan sama sekali (tiada kuorum atau semua orang mengundi untuk pilihan unik mereka sendiri, dsb. .), dan kadangkala (dalam pengundian berbilang peringkat) minoriti boleh memaksakan kehendaknya kepada majoriti.

Pilihan di bawah Ketidakpastian

Kepastian ialah kes ketidakpastian khas, iaitu: ia adalah ketidakpastian yang hampir kepada sifar.

Dalam teori pilihan moden, dipercayai bahawa terdapat tiga jenis utama ketidakpastian dalam masalah membuat keputusan:

  1. Ketidakpastian maklumat (statistik) data awal untuk membuat keputusan.
  2. Ketidakpastian akibat daripada membuat keputusan (pilihan).
  3. Kekaburan dalam penerangan tentang komponen proses membuat keputusan.

Mari kita pertimbangkan mengikut urutan.

Ketidakpastian maklumat (statistik) dalam data awal

Data yang diperoleh tentang kawasan subjek tidak boleh dianggap sebagai tepat secara mutlak. Di samping itu, adalah jelas bahawa data ini menarik minat kita bukan pada diri mereka sendiri, tetapi hanya sebagai isyarat yang, mungkin, membawa maklumat tertentu tentang perkara yang kita benar-benar berminat. Oleh itu, adalah lebih realistik untuk mempertimbangkan bahawa kami berurusan dengan data yang bukan sahaja bising dan tidak tepat, tetapi juga tidak langsung, dan mungkin tidak lengkap. Di samping itu, data ini tidak melibatkan keseluruhan populasi (umum) yang dikaji, tetapi hanya subset tertentu daripadanya, yang mana kami sebenarnya dapat mengumpul data, tetapi pada masa yang sama kami ingin membuat kesimpulan tentang keseluruhan populasi, dan kami juga ingin mengetahui tahap kebolehpercayaan kesimpulan ini.

Di bawah keadaan ini, teori keputusan statistik digunakan.

Terdapat dua sumber utama ketidakpastian dalam teori ini. Pertama, tidak diketahui pengedaran apa yang dipatuhi oleh data asal. Kedua, tidak diketahui taburan apa yang mempunyai set (populasi umum) yang mana kita ingin membuat kesimpulan daripada subsetnya yang membentuk data awal.

Prosedur statistik ialah prosedur membuat keputusan yang menghapuskan kedua-dua jenis ketidakpastian ini.

Perlu diingatkan bahawa terdapat beberapa sebab yang membawa kepada penggunaan kaedah statistik yang salah:

  • inferens statistik, seperti mana-mana yang lain, sentiasa mempunyai beberapa kebolehpercayaan atau kepastian yang pasti. Tetapi, tidak seperti kebanyakan kes lain, kebolehpercayaan penemuan statistik diketahui dan ditentukan dalam perjalanan penyelidikan statistik;
  • kualiti penyelesaian yang diperoleh hasil daripada menggunakan prosedur statistik bergantung pada kualiti data awal;
  • data yang tidak mempunyai sifat statistik tidak boleh tertakluk kepada pemprosesan statistik;
  • adalah perlu untuk menggunakan prosedur statistik yang sepadan dengan tahap maklumat apriori tentang populasi yang dikaji (contohnya, anda tidak seharusnya menggunakan kaedah analisis varians kepada data bukan Gaussian). Jika pengedaran data asal tidak diketahui, maka seseorang mesti sama ada menetapkannya, atau menggunakan beberapa kaedah berbeza dan membandingkan hasilnya. Jika ia sangat berbeza, ini menunjukkan ketidakbolehgunaan beberapa prosedur yang digunakan.

Ketidakpastian Akibat

Apabila akibat daripada memilih satu atau alternatif lain secara unik ditentukan oleh alternatif itu sendiri, maka kita tidak dapat membezakan antara alternatif dan akibatnya, mengambil mudah bahawa memilih alternatif, kita sebenarnya memilih akibatnya.

Walau bagaimanapun, dalam amalan sebenar, seseorang sering terpaksa berhadapan dengan situasi yang lebih kompleks, apabila pilihan satu atau alternatif lain secara samar-samar menentukan akibat daripada pilihan yang dibuat.

Dalam kes set diskret alternatif dan hasil pilihan mereka, dengan syarat set kemungkinan hasil adalah biasa kepada semua alternatif, kita boleh menganggap bahawa alternatif yang berbeza berbeza antara satu sama lain dalam pengagihan kebarangkalian hasil. Taburan kebarangkalian ini, dalam kes umum, mungkin bergantung pada keputusan pilihan alternatif dan hasil yang sebenarnya berlaku akibat daripada ini. Dalam kes yang paling mudah, hasilnya adalah sama besar kemungkinannya. Hasil itu sendiri biasanya mempunyai makna keuntungan atau kerugian dan diukur.

Jika hasil adalah sama untuk semua alternatif, maka tiada apa untuk dipilih. Jika mereka berbeza, maka alternatif boleh dibandingkan dengan memperkenalkan anggaran kuantitatif tertentu untuk mereka. Pelbagai masalah dalam teori permainan dikaitkan dengan pilihan ciri berangka kerugian dan keuntungan yang berbeza akibat daripada pilihan alternatif, darjah konflik yang berbeza antara pihak yang memilih alternatif, dsb.

Pertimbangkan jenis ketidakpastian ini sebagai ketidakpastian yang tidak jelas

Sebarang masalah pilihan adalah penyempitan matlamat bagi set alternatif. Kedua-dua penerangan rasmi alternatif (senarai mereka sendiri, senarai atribut atau parameter mereka) dan perihalan peraturan untuk perbandingan mereka (kriteria, hubungan) sentiasa diberikan dari segi satu atau skala pengukuran yang lain (walaupun apabila orang yang adakah ini tidak tahu tentang ini).

Adalah diketahui bahawa semua skala adalah kabur, tetapi pada tahap yang berbeza-beza. Istilah "kabur" merujuk kepada sifat skala, yang terdiri daripada fakta bahawa ia sentiasa mungkin untuk membentangkan dua alternatif yang boleh dibezakan, i.e. berbeza dalam satu skala dan tidak dapat dibezakan, i.e. adalah sama, dalam yang lain - lebih kabur. Semakin sedikit penggredan dalam skala tertentu, semakin kaburnya.

Oleh itu, kita dapat melihat dengan jelas alternatif dan pada masa yang sama mengelaskannya secara samar-samar, i.e. menjadi samar-samar tentang kelas mana mereka berada.

Sudah dalam kerja pertama mereka dalam membuat keputusan dalam situasi kabur, Bellman dan Zadeh mengemukakan idea bahawa kedua-dua matlamat dan kekangan harus diwakili sebagai set kabur (kabur) pada set alternatif.

Mengenai beberapa batasan pendekatan pengoptimuman

Dalam semua masalah pemilihan dan kaedah membuat keputusan yang dipertimbangkan di atas, masalahnya adalah untuk mencari yang terbaik dalam set awal di bawah syarat yang diberikan, i.e. alternatif yang optimum dalam erti kata tertentu.

Idea optimum adalah idea utama sibernetik dan telah memasuki amalan reka bentuk dan pengendalian sistem teknikal. Pada masa yang sama, idea ini perlu ditangani dengan berhati-hati apabila kita cuba memindahkannya ke kawasan pengurusan sistem yang kompleks, besar, dan lemah, seperti, sebagai contoh, sistem sosio-ekonomi.

Terdapat sebab yang baik untuk kesimpulan ini. Mari kita pertimbangkan beberapa daripada mereka:

  1. Penyelesaian optimum sering menjadi tidak stabil, i.e. perubahan kecil dalam keadaan masalah, data input atau kekangan boleh membawa kepada pemilihan alternatif yang jauh berbeza.
  2. Model pengoptimuman dibangunkan hanya untuk kelas sempit tugas yang agak mudah yang tidak selalu menggambarkan objek kawalan sebenar dengan secukupnya dan sistematik. Selalunya, kaedah pengoptimuman membolehkan untuk mengoptimumkan hanya subsistem yang agak mudah dan diterangkan secara formal bagi beberapa sistem yang besar dan kompleks, i.e. benarkan pengoptimuman tempatan sahaja. Walau bagaimanapun, jika setiap subsistem beberapa sistem besar berfungsi secara optimum, ini tidak bermakna sama sekali bahawa sistem secara keseluruhan juga akan berfungsi secara optimum. Oleh itu, pengoptimuman subsistem tidak semestinya membawa kepada kelakuannya, yang diperlukan daripadanya apabila mengoptimumkan sistem secara keseluruhan. Selain itu, kadangkala pengoptimuman tempatan boleh membawa kepada akibat negatif untuk sistem secara keseluruhan. Oleh itu, apabila mengoptimumkan subsistem dan sistem secara keseluruhan, adalah perlu untuk menentukan pokok matlamat dan submatlamat dan keutamaannya.
  3. Selalunya, memaksimumkan kriteria pengoptimuman mengikut beberapa model matematik dianggap sebagai matlamat pengoptimuman, tetapi sebenarnya matlamatnya adalah untuk mengoptimumkan objek kawalan. Kriteria pengoptimuman dan model matematik sentiasa berkaitan dengan matlamat sahaja secara tidak langsung, i.e. lebih kurang mencukupi, tetapi sentiasa anggaran.

Oleh itu, idea keoptimuman, yang sangat bermanfaat untuk sistem yang meminjamkan diri mereka kepada pemformalkan matematik yang mencukupi, mesti dipindahkan ke sistem yang kompleks dengan berhati-hati. Sudah tentu, model matematik yang kadangkala boleh dicadangkan untuk sistem sedemikian boleh dioptimumkan. Walau bagaimanapun, seseorang harus sentiasa mengambil kira penyederhanaan yang kuat bagi model ini, yang dalam kes sistem yang kompleks tidak boleh diabaikan lagi, serta hakikat bahawa tahap kecukupan model ini dalam kes sistem yang kompleks sebenarnya tidak diketahui. . Oleh itu, tidak diketahui apakah kepentingan praktikal semata-mata pengoptimuman ini. Kepraktisan pengoptimuman yang tinggi dalam sistem teknikal tidak seharusnya menimbulkan ilusi bahawa ia akan sama berkesan dalam mengoptimumkan sistem yang kompleks. Pemodelan matematik yang bermakna bagi sistem kompleks adalah sangat sukar, anggaran dan tidak tepat. Semakin kompleks sistem, semakin berhati-hati tentang idea pengoptimumannya.

Oleh itu, apabila membangunkan kaedah kawalan untuk sistem yang kompleks, besar, ditentukan dengan lemah, penulis menganggap perkara utama bukan sahaja optimum pendekatan yang dipilih dari sudut pandangan matematik formal, tetapi juga kecukupannya kepada matlamat dan sifat sebenar objek kawalan.

Kaedah Pemilihan Pakar

Dalam kajian sistem yang kompleks, masalah sering timbul yang, atas pelbagai sebab, tidak dapat dikemukakan dan diselesaikan dengan teliti menggunakan radas matematik yang sedang dibangunkan. Dalam kes ini, perkhidmatan pakar (penganalisis sistem) digunakan, yang pengalaman dan intuisinya membantu mengurangkan kerumitan masalah.

Walau bagaimanapun, ia mesti diambil kira bahawa pakar sendiri adalah sistem yang sangat kompleks, dan aktiviti mereka juga bergantung pada banyak keadaan luaran dan dalaman. Oleh itu, dalam kaedah menganjurkan penilaian pakar, banyak perhatian diberikan untuk mewujudkan keadaan luaran dan psikologi yang menggalakkan untuk kerja pakar.

Faktor berikut mempengaruhi kerja pakar:

  • tanggungjawab untuk menggunakan keputusan peperiksaan;
  • mengetahui bahawa pakar lain terlibat;
  • ketersediaan maklumat hubungan antara pakar;
  • hubungan interpersonal pakar (jika terdapat hubungan maklumat antara mereka);
  • kepentingan peribadi pakar dalam hasil penilaian;
  • kualiti peribadi pakar (harga diri, kepatuhan, kehendak, dll.)

Interaksi antara pakar boleh merangsang atau menghalang aktiviti mereka. Oleh itu, dalam kes yang berbeza, kaedah pemeriksaan yang berbeza digunakan, yang berbeza dalam sifat interaksi pakar antara satu sama lain: tinjauan dan soal selidik tanpa nama dan terbuka, mesyuarat, perbincangan, permainan perniagaan, sumbang saran, dll.

Terdapat pelbagai kaedah pemprosesan matematik pendapat pakar. Pakar diminta menilai pelbagai alternatif sama ada secara satu atau dengan sistem penunjuk. Di samping itu, mereka diminta menilai tahap kepentingan setiap penunjuk ("berat" atau "sumbangan"). Pakar itu sendiri juga diberikan tahap kecekapan yang sepadan dengan sumbangan setiap daripada mereka kepada pendapat kumpulan yang terhasil.

Kaedah yang dibangunkan untuk bekerja dengan pakar ialah kaedah "Delphi". Idea utama kaedah ini ialah kritikan dan penghujahan mempunyai kesan yang baik kepada pakar, jika harga dirinya tidak terjejas dan syarat-syarat disediakan yang tidak termasuk konfrontasi peribadi.

Perlu ditekankan bahawa terdapat perbezaan asas dalam sifat penggunaan kaedah pakar dalam sistem pakar dan dalam sokongan keputusan. Jika dalam kes pertama, pakar dikehendaki untuk memformalkan kaedah membuat keputusan, maka dalam kedua - hanya keputusan itu sendiri, seperti itu.

Memandangkan pakar terlibat dalam pelaksanaan tepat fungsi tersebut yang pada masa ini sama ada tidak disediakan oleh sistem automatik sama sekali, atau dilakukan lebih teruk daripada manusia, hala tuju yang menjanjikan dalam pembangunan sistem automatik adalah automasi maksimum fungsi ini.

Sistem sokongan keputusan automatik

Seseorang sentiasa menggunakan pembantu dalam membuat keputusan: mereka berdua hanyalah pembekal maklumat tentang objek kawalan, dan perunding (penasihat) yang menawarkan pilihan untuk membuat keputusan dan menganalisis akibatnya. Orang yang membuat keputusan sentiasa membuat mereka dalam persekitaran maklumat tertentu: untuk komander tentera, ini adalah ibu pejabat, untuk rektor, majlis akademik, untuk menteri, kolej.

Pada zaman kita, infrastruktur maklumat membuat keputusan tidak dapat difikirkan tanpa sistem automatik untuk penilaian keputusan berulang dan terutamanya sistem sokongan keputusan (DDS - Sistem Sokongan Keputusan), i.e. sistem automatik yang direka khusus untuk menyediakan maklumat yang diperlukan oleh seseorang untuk membuat keputusan. Pembangunan sistem sokongan keputusan dijalankan, khususnya, dalam rangka kerja projek antarabangsa yang dijalankan di bawah naungan Institut Antarabangsa untuk Analisis Sistem Gunaan di Laxenburg (Austria).

Pilihan dalam situasi sebenar memerlukan prestasi beberapa operasi, beberapa daripadanya dilakukan dengan lebih cekap oleh seseorang, dan yang lain oleh mesin. Gabungan berkesan kelebihan mereka dengan pampasan serentak kekurangan terkandung dalam sistem sokongan keputusan automatik.

Seseorang membuat keputusan lebih baik daripada mesin dalam keadaan ketidakpastian, tetapi untuk membuat keputusan yang betul, dia juga memerlukan maklumat yang mencukupi (lengkap dan boleh dipercayai) yang mencirikan kawasan subjek. Walau bagaimanapun, diketahui bahawa seseorang tidak dapat mengatasi dengan baik sejumlah besar maklumat "mentah" yang tidak diproses. Oleh itu, peranan mesin dalam sokongan keputusan mungkin untuk menjalankan penyediaan awal maklumat mengenai objek kawalan dan faktor yang tidak terkawal (persekitaran), untuk membantu melihat akibat membuat keputusan tertentu, dan juga untuk membentangkan semua maklumat ini dalam bentuk visual. dan cara yang mudah untuk membuat keputusan.

Oleh itu, sistem sokongan keputusan automatik mengimbangi kelemahan seseorang, membebaskannya daripada pemprosesan awal maklumat rutin, dan memberikannya persekitaran maklumat yang selesa di mana dia boleh menunjukkan kekuatannya dengan lebih baik. Sistem ini tidak tertumpu pada mengautomasikan fungsi pembuat keputusan (dan, akibatnya, mengasingkan fungsi ini daripadanya, dan dengan itu bertanggungjawab terhadap keputusan yang dibuat, yang selalunya tidak boleh diterima secara amnya), tetapi pada memberinya bantuan dalam mencari penyelesaian yang baik.

  • tutorial

Untuk masa yang lama saya ingin menulis artikel umum yang mengandungi asas-asas Pengecaman Imej, sejenis panduan mengenai kaedah asas, memberitahu bila untuk menggunakannya, tugas apa yang mereka selesaikan, apa yang boleh dilakukan pada waktu petang di lutut anda, dan apa yang lebih baik untuk tidak memikirkan tanpa sepasukan orang dalam 20.

Saya telah menulis beberapa artikel mengenai Pengecaman Optik untuk masa yang lama, jadi beberapa kali sebulan pelbagai orang menulis kepada saya dengan soalan mengenai topik ini. Kadang-kadang anda mendapat perasaan bahawa anda tinggal bersama mereka dalam dunia yang berbeza. Di satu pihak, anda memahami bahawa seseorang itu berkemungkinan besar seorang profesional dalam topik yang berkaitan, tetapi mengetahui sangat sedikit tentang kaedah pengecaman optik. Dan perkara yang paling menjengkelkan ialah dia cuba menggunakan kaedah dari bidang pengetahuan berdekatan, yang logik, tetapi tidak berfungsi sepenuhnya dalam Pengecaman Imej, tetapi tidak memahami perkara ini dan sangat tersinggung jika dia mula memberitahunya sesuatu daripada sangat asas. Dan memandangkan memberitahu dari asas adalah banyak masa, yang selalunya tidak ada, ia menjadi lebih sedih.

Artikel ini direka supaya seseorang yang tidak pernah berurusan dengan kaedah pengecaman imej boleh, dalam masa 10-15 minit, mencipta dalam kepalanya gambaran asas tertentu tentang dunia yang sepadan dengan topik itu, dan memahami ke arah mana dia harus menggali. Banyak kaedah yang diterangkan di sini boleh digunakan untuk pemprosesan radar dan audio.
Saya akan mulakan dengan beberapa prinsip yang selalu kami mulakan kepada bakal pelanggan, atau seseorang yang ingin mula melakukan Pengecaman Optik:

  • Apabila menyelesaikan masalah, sentiasa pergi dari yang paling mudah. Adalah lebih mudah untuk menggantung label oren pada seseorang daripada mengikuti seseorang, menonjolkan dia dalam lata. Lebih mudah untuk mengambil kamera dengan resolusi yang lebih tinggi daripada membangunkan algoritma resolusi super.
  • Pernyataan masalah yang ketat dalam kaedah pengecaman optik adalah susunan magnitud yang lebih penting daripada masalah pengaturcaraan sistem: satu perkataan tambahan dalam TK boleh menambah 50% daripada kerja.
  • Dalam masalah pengiktirafan, tiada penyelesaian universal. Anda tidak boleh membuat algoritma yang hanya akan "mengiktiraf mana-mana inskripsi." Tanda di jalan dan sehelai teks pada asasnya adalah objek yang berbeza. Ia mungkin mungkin untuk membuat algoritma umum (contoh yang baik daripada Google), tetapi ini memerlukan banyak kerja daripada pasukan yang besar dan terdiri daripada berpuluh-puluh subrutin yang berbeza.
  • OpenCV ialah bible, yang mempunyai banyak kaedah, dan dengan mana anda boleh menyelesaikan 50% daripada jumlah hampir semua masalah, tetapi OpenCV hanyalah sebahagian kecil daripada apa yang boleh dilakukan dalam realiti. Dalam satu kajian, ia ditulis dalam kesimpulan: "Masalahnya tidak diselesaikan dengan kaedah OpenCV, oleh itu, ia tidak dapat diselesaikan." Cuba elakkan ini, jangan malas dan teliti tugas semasa setiap kali dari awal, tanpa menggunakan templat OpenCV.
Adalah sangat sukar untuk memberikan beberapa jenis nasihat sejagat, atau memberitahu cara mencipta beberapa jenis struktur yang mana anda boleh membina penyelesaian kepada masalah penglihatan komputer yang sewenang-wenangnya. Tujuan artikel ini adalah untuk menstrukturkan apa yang boleh digunakan. Saya akan cuba memecahkan kaedah sedia ada kepada tiga kumpulan. Kumpulan pertama ialah pra-penapisan dan penyediaan imej. Kumpulan kedua ialah pemprosesan logik hasil penapisan. Kumpulan ketiga ialah algoritma membuat keputusan berdasarkan pemprosesan logik. Sempadan antara kumpulan sangat sewenang-wenangnya. Untuk menyelesaikan masalah, tidak semestinya perlu menggunakan kaedah dari semua kumpulan; kadang-kadang dua sudah cukup, dan kadang-kadang satu.

Senarai kaedah yang dibentangkan di sini tidak lengkap. Saya bercadang untuk menambah dalam komen kaedah kritikal yang saya tidak tulis dan atribut 2-3 perkataan yang disertakan untuk setiap satu.

Bahagian 1. Penapisan

Dalam kumpulan ini, saya meletakkan kaedah yang membolehkan anda memilih kawasan yang menarik dalam imej tanpa menganalisisnya. Kebanyakan kaedah ini menggunakan beberapa jenis transformasi seragam pada semua titik dalam imej. Pada peringkat penapisan, imej tidak dianalisis, tetapi titik yang ditapis boleh dianggap sebagai kawasan yang mempunyai ciri khas.
Perduaan ambang, pemilihan kawasan histogram
Transformasi yang paling mudah ialah penduaan imej mengikut ambang. Untuk imej RGB dan skala kelabu, ambang ialah nilai warna. Terdapat masalah ideal di mana transformasi sedemikian adalah mencukupi. Katakan anda ingin memilih item secara automatik pada helaian kertas putih:




Pilihan ambang di mana perduaan berlaku sebahagian besarnya menentukan proses perduaan itu sendiri. Dalam kes ini, imej telah diduakan oleh warna purata. Biasanya, perduaan dilakukan dengan algoritma yang secara adaptif memilih ambang. Algoritma sedemikian boleh menjadi pilihan jangkaan atau mod. Dan anda boleh memilih puncak terbesar histogram.

Perduaan boleh memberikan hasil yang sangat menarik apabila bekerja dengan histogram, termasuk situasi jika kita menganggap imej bukan dalam RGB, tetapi dalam HSV. Contohnya, bahagikan warna yang diminati. Atas prinsip ini, adalah mungkin untuk membina pengesan label dan pengesan kulit manusia.
Penapisan klasik: Fourier, LPF, HPF
Kaedah penapisan klasik daripada radar dan pemprosesan isyarat boleh berjaya digunakan dalam pelbagai tugas Pengecaman Corak. Kaedah tradisional dalam radar, yang hampir tidak pernah digunakan dalam imej dalam bentuk tulennya, ialah transformasi Fourier (lebih khusus, FFT). Salah satu daripada beberapa pengecualian di mana transformasi Fourier 1D digunakan ialah pemampatan imej. Untuk analisis imej, transformasi satu dimensi biasanya tidak mencukupi, anda perlu menggunakan transformasi dua dimensi yang lebih intensif sumber.

Segelintir orang yang benar-benar mengiranya, biasanya lebih cepat dan lebih mudah untuk menggunakan lilitan kawasan yang diminati dengan penapis siap pakai yang diasah kepada frekuensi tinggi (HPF) atau rendah (LPF). Kaedah sedemikian, sudah tentu, tidak membenarkan analisis spektrum, tetapi dalam tugas pemprosesan video tertentu, ia biasanya bukan analisis yang diperlukan, tetapi hasilnya.


Contoh paling mudah penapis yang menekankan frekuensi rendah (penapis Gaussian) dan frekuensi tinggi (penapis Gabor).
Untuk setiap titik imej, tetingkap dipilih dan didarab dengan penapis dengan saiz yang sama. Hasil daripada lilitan sedemikian adalah nilai baru titik. Apabila melaksanakan LPF dan HPF, imej jenis ini diperoleh:



Gelombang
Tetapi bagaimana jika kita menggunakan beberapa fungsi ciri sewenang-wenangnya untuk konvolusi dengan isyarat? Kemudian ia akan dipanggil "Wavelet Transform". Takrif wavelet ini tidak betul, tetapi secara tradisinya, dalam banyak pasukan, analisis wavelet ialah pencarian corak arbitrari dalam imej menggunakan konvolusi dengan model corak ini. Terdapat satu set fungsi klasik yang digunakan dalam analisis wavelet. Ini termasuk wavelet Haar, wavelet Morlet, wavelet topi Mexico, dan sebagainya. Primitif Haar, yang mana terdapat beberapa artikel saya sebelum ini ( , ), merujuk kepada fungsi sedemikian untuk ruang dua dimensi.


Di atas ialah 4 contoh wavelet klasik. Wavelet Haar 3D, Wavelet Meyer 2D, Wavelet Topi Mexico, Wavelet Daubechies. Contoh yang baik untuk menggunakan tafsiran lanjutan bagi wavelet ialah masalah mencari kilauan pada mata, yang mana kilauan itu sendiri ialah wavelet:

Wavelet klasik biasanya digunakan untuk , atau untuk pengelasannya (untuk diterangkan di bawah).
Korelasi
Selepas tafsiran percuma bagi wavelet di pihak saya, adalah wajar untuk menyebut korelasi sebenar yang mendasarinya. Apabila menapis imej, ini adalah alat yang sangat diperlukan. Aplikasi klasik ialah korelasi strim video untuk mencari offset atau strim optik. Pengesan anjakan yang paling mudah juga, dalam erti kata lain, korelasi perbezaan. Di mana imej tidak berkorelasi, terdapat pergerakan.

Penapisan fungsi
Kelas penapis yang menarik ialah fungsi penapisan. Ini adalah penapis matematik semata-mata yang membolehkan anda mengesan fungsi matematik mudah dalam imej (garisan, parabola, bulatan). Imej terkumpul dibina, di mana untuk setiap titik imej asal satu set fungsi yang menjananya dilukis. Transformasi yang paling klasik ialah transformasi Hough untuk garisan. Dalam penjelmaan ini, bagi setiap titik (x;y), satu set titik (a;b) bagi garis y=ax+b dilukis, yang mana kesamaan adalah benar. Dapatkan gambar yang cantik:


(tambahan pertama untuk orang yang pertama mencari tangkapan dalam gambar dan definisi sedemikian dan menerangkannya, tambah kedua untuk orang yang pertama mengatakan apa yang ditunjukkan di sini)
Transformasi Hough membolehkan anda mencari sebarang fungsi boleh parameter. Contohnya bulatan. Terdapat transformasi yang diubah suai yang membolehkan anda mencari sebarang . Transformasi ini sangat menyukai ahli matematik. Tetapi apabila memproses imej, malangnya, ia tidak selalu berfungsi. Kelajuan yang sangat perlahan, sensitiviti yang sangat tinggi terhadap kualiti binarisasi. Walaupun dalam situasi yang ideal, saya lebih suka bertahan dengan kaedah lain.
Rakan setara dengan penjelmaan Hough untuk garisan ialah penjelmaan Radon. Ia dikira melalui FFT, yang memberikan keuntungan prestasi dalam keadaan di mana terdapat banyak mata. Di samping itu, ia boleh digunakan pada imej bukan binari.
Penapisan kontur
Kelas penapis yang berasingan ialah penapisan sempadan dan kontur. Laluan sangat berguna apabila kita ingin beralih daripada bekerja dengan imej kepada bekerja dengan objek dalam imej itu. Apabila objek agak kompleks, tetapi dibezakan dengan baik, maka selalunya satu-satunya cara untuk bekerja dengannya ialah memilih konturnya. Terdapat beberapa algoritma yang menyelesaikan masalah penapisan kontur:

Yang paling biasa digunakan ialah Kenny, yang berfungsi dengan baik dan pelaksanaannya dalam OpenCV (Sobel juga ada, tetapi dia mencari kontur yang lebih teruk).



Penapis lain
Di atas adalah penapis, pengubahsuaian yang membantu menyelesaikan 80-90% tugas. Tetapi selain mereka, terdapat lebih banyak penapis yang jarang digunakan dalam tugas tempatan. Terdapat berpuluh-puluh penapis sedemikian, saya tidak akan menyenaraikan semuanya. Yang menarik ialah penapis lelaran (contohnya ), serta transformasi ridgelet dan curvlet, yang merupakan aloi penapisan wavelet klasik dan analisis dalam medan transformasi radon. Transformasi Beamlet berfungsi dengan baik pada sempadan transformasi wavelet dan analisis logik, membolehkan anda menyerlahkan kontur:

Tetapi transformasi ini sangat khusus dan disesuaikan untuk tugas yang jarang berlaku.

Bahagian 2. Pemprosesan logik hasil penapisan

Penapisan memberikan satu set data yang sesuai untuk diproses. Tetapi selalunya anda tidak boleh mengambil dan menggunakan data ini tanpa memprosesnya. Dalam bahagian ini, akan terdapat beberapa kaedah klasik yang membolehkan anda beralih daripada imej kepada sifat objek, atau kepada objek itu sendiri.
Morfologi
Peralihan daripada penapisan kepada logik, pada pendapat saya, adalah kaedah morfologi matematik ( , ). Sebenarnya, ini adalah operasi paling mudah untuk meningkatkan dan menghakis imej binari. Kaedah ini membolehkan anda mengeluarkan bunyi daripada imej binari dengan menambah atau mengurangkan elemen yang tersedia. Berdasarkan morfologi matematik, terdapat algoritma kontur, tetapi biasanya mereka menggunakan beberapa jenis algoritma hibrid atau algoritma secara bersama.
analisis kontur
Dalam bahagian penapisan, algoritma untuk mendapatkan sempadan telah disebutkan. Sempadan yang terhasil agak mudah ditukar kepada kontur. Untuk algoritma Canny ini berlaku secara automatik, untuk algoritma lain perduaan tambahan diperlukan. Anda boleh mendapatkan kontur untuk algoritma binari, contohnya, dengan algoritma kumbang.
Kontur adalah ciri unik sesuatu objek. Selalunya ini membolehkan anda mengenal pasti objek sepanjang kontur. Terdapat alat matematik yang berkuasa yang membolehkan anda melakukan ini. Radas dipanggil analisis kontur ( , ).

Sejujurnya, saya tidak pernah berjaya menerapkan analisis kontur dalam masalah sebenar. Keadaan yang terlalu ideal diperlukan. Sama ada tiada sempadan, atau terlalu banyak bunyi. Tetapi, jika anda perlu mengenali sesuatu dalam keadaan yang ideal, maka analisis kontur adalah pilihan yang bagus. Ia berfungsi dengan sangat pantas, matematik yang indah dan logik yang boleh difahami.
Titik tunggal
Keypoints ialah ciri unik objek yang membenarkan objek dikaitkan dengan dirinya sendiri atau dengan kelas objek yang serupa. Terdapat berpuluh-puluh cara untuk memilih mata sedemikian. Sesetengah kaedah menyerlahkan titik khas dalam bingkai jiran, sesetengahnya selepas tempoh masa yang lama dan apabila pencahayaan berubah, sesetengahnya membolehkan anda mencari titik khas yang kekal begitu walaupun objek berputar. Mari kita mulakan dengan kaedah yang membolehkan kita mencari mata khas yang tidak begitu stabil, tetapi dikira dengan cepat, dan kemudian kita akan meningkatkan kerumitan:
Gred pertama. Titik tunggal yang stabil untuk beberapa saat. Titik sedemikian digunakan untuk membimbing objek antara bingkai video bersebelahan, atau untuk menumpu imej daripada kamera jiran. Titik ini termasuk maksimum tempatan imej, sudut dalam imej (pengesan terbaik, mungkin pengesan Haris), titik di mana maksimum penyebaran dicapai, kecerunan tertentu, dsb.
Kelas kedua. Titik tunggal yang stabil apabila menukar pencahayaan dan pergerakan kecil objek. Mata sedemikian berfungsi terutamanya untuk latihan dan pengelasan jenis objek seterusnya. Sebagai contoh, pengelas pejalan kaki atau pengelas muka ialah hasil daripada sistem yang dibina pada titik sedemikian sahaja. Beberapa wavelet yang disebutkan sebelum ini mungkin menjadi asas untuk mata tersebut. Contohnya, primitif Haar, carian silau, cari ciri khusus lain. Titik ini termasuk titik yang ditemui dengan kaedah histogram kecerunan arah (HOG).
Kelas ketiga. mata yang stabil. Saya hanya tahu tentang dua kaedah yang memberikan kestabilan lengkap dan tentang pengubahsuaian mereka. Ini dan . Ia membolehkan anda mencari perkara utama walaupun anda memutarkan imej. Pengiraan mata sedemikian mengambil masa lebih lama daripada kaedah lain, tetapi untuk masa yang agak terhad. Malangnya, kaedah ini dipatenkan. Walaupun, di Rusia adalah mustahil untuk mematenkan algoritma, jadi gunakannya untuk pasaran domestik.

Bahagian 3. Latihan

Bahagian ketiga cerita akan ditumpukan kepada kaedah yang tidak berfungsi secara langsung dengan imej, tetapi yang membolehkan anda membuat keputusan. Pada asasnya, ini adalah pelbagai kaedah pembelajaran mesin dan membuat keputusan. Baru-baru ini, Yandyks menyiarkan pada Habr mengenai topik ini, terdapat pilihan yang sangat baik. Ini adalah dalam versi teks. Untuk kajian serius tentang subjek, saya amat mengesyorkan anda melihatnya. Di sini saya akan cuba mengenal pasti beberapa kaedah asas yang digunakan secara khusus dalam pengecaman corak.
Dalam 80% situasi, intipati pembelajaran dalam masalah pengecaman adalah seperti berikut:
Terdapat sampel ujian yang terdapat beberapa kelas objek. Biarlah kehadiran / ketiadaan seseorang dalam foto. Bagi setiap imej, terdapat satu set ciri yang telah diserlahkan oleh beberapa ciri, sama ada Haar, HOG, SURF atau beberapa wavelet. Algoritma pembelajaran mesti membina model sedemikian, mengikut mana ia akan dapat menganalisis imej baharu dan menentukan objek mana yang ada dalam imej.
Bagaimana ia dilakukan? Setiap imej ujian adalah titik dalam ruang ciri. Koordinatnya ialah berat setiap ciri dalam imej. Biarkan tanda-tanda kami: "Kehadiran mata", "Kehadiran hidung", "Kehadiran dua tangan", "Kehadiran telinga", dll. Kami akan memperuntukkan semua tanda ini dengan pengesan yang kami ada, yang dilatih pada bahagian tubuh yang serupa dengan manusia. Bagi seseorang dalam ruang sedemikian, titik yang betul ialah . Untuk monyet, titik untuk kuda. Pengelas dilatih pada sampel contoh. Tetapi tidak semua gambar menunjukkan tangan, yang lain tidak mempunyai mata, dan pada yang ketiga monyet itu mempunyai hidung manusia kerana kesilapan pengelas. Pengelas manusia boleh dilatih secara automatik membahagikan ruang ciri sedemikian rupa untuk mengatakan: jika ciri pertama terletak dalam julat 0.5 Pada dasarnya, tujuan pengelas adalah untuk menarik dalam ruang ciri kawasan ciri objek pengelasan. Beginilah cara penghampiran berturut-turut kepada jawapan untuk salah satu pengelas (AdaBoost) dalam ruang dua dimensi akan kelihatan seperti:


Terdapat banyak pengelas. Setiap daripada mereka berfungsi dengan lebih baik dalam beberapa tugasnya. Tugas memilih pengelas untuk tugas tertentu sebahagian besarnya adalah seni. Berikut adalah beberapa gambar yang bagus mengenai topik tersebut.
Kes mudah, pemisahan satu dimensi
Mari kita ambil contoh kes pengelasan yang paling mudah, apabila ruang ciri adalah satu dimensi, dan kita perlu memisahkan 2 kelas. Situasi berlaku lebih kerap daripada yang mungkin kelihatan: contohnya, apabila anda perlu membezakan dua isyarat, atau membandingkan corak dengan sampel. Katakan kita mempunyai sampel latihan. Dalam kes ini, imej diperoleh, di mana paksi-X akan menjadi ukuran persamaan, dan paksi-Y akan menjadi bilangan peristiwa dengan ukuran sedemikian. Apabila objek yang diingini serupa dengan dirinya, Gaussian kiri diperoleh. Apabila tidak serupa - betul. Nilai X=0.4 memisahkan sampel supaya keputusan yang salah meminimumkan kebarangkalian membuat sebarang keputusan yang salah. Ia adalah mencari pemisah sedemikian yang merupakan tugas pengelasan.


Nota kecil. Kriteria yang meminimumkan ralat tidak akan sentiasa optimum. Graf berikut ialah graf sistem pengecaman iris sebenar. Untuk sistem sedemikian, kriteria dipilih sedemikian rupa untuk meminimumkan kebarangkalian kemasukan palsu orang luar ke objek tersebut. Kebarangkalian sedemikian dipanggil "ralat jenis pertama", "kebarangkalian penggera palsu", "positif palsu". Dalam kesusasteraan Inggeris "Kadar Akses Palsu".
) AdaBusta ialah salah satu pengelas yang paling biasa. Sebagai contoh, lata Haar dibina di atasnya. Biasanya digunakan apabila klasifikasi binari diperlukan, tetapi tiada apa yang menghalang pengajaran untuk lebih banyak kelas.
SVM ( , , , ) Salah satu pengelas paling berkuasa dengan banyak pelaksanaan. Pada dasarnya, pada tugasan pembelajaran yang saya temui, ia berfungsi sama seperti adabusta. Ia dianggap agak pantas, tetapi latihannya lebih sukar daripada Adabusta dan memerlukan pilihan teras yang betul.

Terdapat juga rangkaian saraf dan regresi. Tetapi untuk mengelaskannya secara ringkas dan menunjukkan perbezaannya, artikel yang lebih panjang daripada ini diperlukan.
________________________________________________
Saya harap saya dapat memberikan gambaran ringkas tentang kaedah yang digunakan tanpa menyelami matematik dan penerangan. Mungkin ini akan membantu seseorang. Walaupun, sudah tentu, artikel itu tidak lengkap dan tidak ada perkataan tentang bekerja dengan imej stereo, atau mengenai LSM dengan penapis Kalman, atau mengenai pendekatan Bayesian adaptif.
Jika anda menyukai artikel tersebut, maka saya akan cuba membuat bahagian kedua dengan pilihan contoh bagaimana masalah ImageRecognition yang sedia ada diselesaikan.

Dan akhirnya

Apa yang perlu dibaca?
1) Suatu ketika dahulu saya sangat menyukai buku "Digital Image Processing" oleh B. Yana, yang ditulis dengan ringkas dan jelas, tetapi pada masa yang sama hampir semua matematik diberikan. Baik untuk membiasakan diri dengan kaedah sedia ada.
2) Klasik genre ialah R Gonzalez, R. Woods "Pemprosesan Imej Digital". Atas sebab tertentu, ia lebih sukar bagi saya daripada yang pertama. Lebih kurang matematik, tetapi lebih banyak kaedah dan gambar.
3) "Pemprosesan dan analisis imej dalam masalah penglihatan mesin" - ditulis berdasarkan kursus yang diajar di salah satu jabatan PhysTech. Banyak kaedah dan penerangan terperinci mereka. Tetapi pada pendapat saya, buku itu mempunyai dua kelemahan besar: buku itu sangat tertumpu pada pakej perisian yang disertakan dengannya, dalam buku terlalu kerap penerangan kaedah mudah berubah menjadi hutan matematik, yang sukar untuk dikeluarkan. gambarajah struktur kaedah. Tetapi pengarang telah membuat tapak yang mudah, di mana hampir semua kandungan dibentangkan - wiki.technicalvision.ru Tambah tag

Kaedah lelaran. Dalam kaedah ini, perbandingan dibuat dengan pangkalan data tertentu, di mana bagi setiap objek terdapat pilihan yang berbeza untuk mengubah suai paparan. Contohnya, untuk pengecaman imej optikal, anda boleh menggunakan kaedah lelaran pada sudut atau skala yang berbeza, mengimbangi, ubah bentuk, dsb. Untuk huruf, anda boleh lelaran pada fon atau sifatnya. Dalam kes pengecaman corak bunyi, terdapat perbandingan dengan beberapa pola yang diketahui (perkataan yang dituturkan oleh ramai orang). Selanjutnya, analisis yang lebih mendalam tentang ciri-ciri imej dilakukan. Dalam kes pengecaman optik, ini mungkin definisi ciri geometri. Sampel bunyi dalam kes ini tertakluk kepada analisis frekuensi dan amplitud.

Kaedah seterusnya ialah penggunaan rangkaian saraf tiruan(INS). Ia memerlukan sama ada sejumlah besar contoh tugas pengecaman, atau struktur rangkaian saraf khas yang mengambil kira spesifik tugas ini. Tetapi, bagaimanapun, kaedah ini dicirikan oleh kecekapan dan produktiviti yang tinggi.

Kaedah berdasarkan anggaran kepadatan taburan nilai ciri. Dipinjam daripada teori klasik keputusan statistik, di mana objek kajian dianggap sebagai realisasi pembolehubah rawak berbilang dimensi yang diedarkan dalam ruang ciri mengikut beberapa undang-undang. Ia adalah berdasarkan skema membuat keputusan Bayesian, yang menarik kepada kebarangkalian awal objek yang dimiliki oleh kelas tertentu dan kepadatan pengedaran ciri bersyarat.

Kumpulan kaedah berdasarkan anggaran ketumpatan taburan nilai ciri secara langsung berkaitan dengan kaedah analisis diskriminasi. Pendekatan Bayesian untuk membuat keputusan adalah salah satu kaedah parametrik yang paling maju dalam statistik moden, yang mana ungkapan analitik bagi hukum taburan (hukum normal) dianggap diketahui dan hanya sebilangan kecil parameter (vektor min dan matriks kovarians ) perlu dianggarkan. Kesukaran utama dalam menggunakan kaedah ini dianggap sebagai keperluan untuk mengingati keseluruhan sampel latihan untuk mengira anggaran ketumpatan dan kepekaan yang tinggi terhadap sampel latihan.

Kaedah berdasarkan andaian tentang kelas fungsi keputusan. Dalam kumpulan ini, jenis fungsi keputusan dianggap diketahui dan fungsi kualitinya diberikan. Berdasarkan fungsi ini, anggaran optimum kepada fungsi keputusan didapati daripada urutan latihan. Fungsi kualiti peraturan keputusan biasanya dikaitkan dengan ralat. Kelebihan utama kaedah ini ialah kejelasan rumusan matematik masalah pengecaman. Kemungkinan mengekstrak pengetahuan baru tentang sifat objek, khususnya, pengetahuan tentang mekanisme interaksi atribut, pada asasnya terhad di sini oleh struktur interaksi tertentu, ditetapkan dalam bentuk fungsi keputusan yang dipilih.

Kaedah perbandingan prototaip. Ini adalah kaedah pengecaman lanjutan yang paling mudah dalam amalan. Ia terpakai apabila kelas yang boleh dikenali ditunjukkan sebagai kelas geometri padat. Kemudian pusat kumpulan geometri (atau objek yang paling hampir dengan pusat) dipilih sebagai titik prototaip.

Untuk mengelaskan objek tak tentu, prototaip yang paling hampir dengannya ditemui, dan objek itu tergolong dalam kelas yang sama dengannya. Jelas sekali, tiada imej umum terbentuk dalam kaedah ini. Pelbagai jenis jarak boleh digunakan sebagai ukuran.

Kaedah k jiran terdekat. Kaedah ini terletak pada fakta bahawa apabila mengelaskan objek yang tidak diketahui, nombor tertentu (k) ruang ciri terdekat secara geometri bagi jiran terdekat lain yang sudah diketahui kepunyaan kelas ditemui. Keputusan untuk menetapkan objek yang tidak diketahui dibuat dengan menganalisis maklumat tentang jiran terdekatnya. Keperluan untuk mengurangkan bilangan objek dalam sampel latihan (pendahuluan diagnostik) adalah kelemahan kaedah ini, kerana ini mengurangkan keterwakilan sampel latihan.

Berdasarkan fakta bahawa algoritma pengecaman berbeza berkelakuan berbeza pada sampel yang sama, persoalan timbul tentang peraturan keputusan sintetik yang akan menggunakan kekuatan semua algoritma. Untuk ini, terdapat kaedah sintetik atau set peraturan keputusan yang menggabungkan aspek paling positif bagi setiap kaedah.

Sebagai kesimpulan kajian semula kaedah pengiktirafan, kami membentangkan intipati perkara di atas dalam jadual ringkasan, menambah beberapa kaedah lain yang digunakan dalam amalan.

Jadual 1. Jadual klasifikasi kaedah pengecaman, perbandingan kawasan penggunaan dan hadnya

Klasifikasi kaedah pengecaman

Kawasan permohonan

Had (kelemahan)

Kaedah pengecaman intensif

Kaedah berdasarkan anggaran ketumpatan

Masalah dengan pengedaran yang diketahui (normal), keperluan untuk mengumpul statistik yang besar

Keperluan untuk menghitung keseluruhan set latihan semasa pengiktirafan, kepekaan yang tinggi terhadap ketakwakilan set latihan dan artifak

Kaedah berasaskan andaian

Kelas hendaklah boleh dipisahkan dengan baik

Bentuk fungsi keputusan mesti diketahui terlebih dahulu. Kemustahilan untuk mengambil kira pengetahuan baru tentang korelasi antara ciri

Kaedah Boolean

Masalah dimensi kecil

Apabila memilih peraturan keputusan logik, penghitungan yang lengkap diperlukan. Keamatan buruh yang tinggi

Kaedah Linguistik

Tugas menentukan tatabahasa untuk set pernyataan tertentu (penerangan objek) sukar untuk diformalkan. Masalah teori yang tidak dapat diselesaikan

Kaedah pengiktirafan lanjutan

Kaedah perbandingan prototaip

Masalah dimensi kecil ruang ciri

Kebergantungan tinggi keputusan klasifikasi pada metrik. Ketidakpastian metrik optimum

k kaedah jiran terdekat

Kebergantungan tinggi keputusan klasifikasi pada metrik. Keperluan untuk penghitungan lengkap sampel latihan semasa pengiktirafan. Kerumitan pengiraan

Algoritma Pengiraan Gred (ABO)

Masalah dimensi kecil dari segi bilangan kelas dan ciri

Kebergantungan keputusan klasifikasi pada metrik. Keperluan untuk penghitungan lengkap sampel latihan semasa pengiktirafan. Kerumitan teknikal kaedah yang tinggi

Kolektif peraturan keputusan (CRC) adalah kaedah sintetik.

Masalah dimensi kecil dari segi bilangan kelas dan ciri

Kerumitan teknikal kaedah yang sangat tinggi, bilangan masalah teori yang tidak dapat diselesaikan, baik dalam menentukan bidang kecekapan kaedah tertentu, dan dalam kaedah tertentu itu sendiri