ชีวประวัติ ลักษณะเฉพาะ การวิเคราะห์

ข้อดีของการนำเสนอข้อมูลในรูปแบบภาพ วิธีการนำเสนอข้อมูลด้วยภาพ

2.1. ข้อดี รูปแบบภาพการนำเสนอข้อมูล

ภาษาวาจาและหมวดหมู่วาจามีวิธีดั้งเดิมอย่างยิ่งในการสร้างพื้นที่ ตีความ หรือทำอะไรบางอย่างกับพื้นที่นั้น เป้าหมายนี้ให้บริการโดยภาษาของภาพและระบบการรับรู้ด้วยความช่วยเหลือที่บุคคลสร้างภาพของความเป็นจริงโดยรอบและปรับทิศทางตัวเองในนั้น ระบบนี้เรียกว่าการรับรู้ การรับรู้ถูกกำหนดให้เป็นภาพองค์รวมที่สะท้อนถึงความสามัคคีของโครงสร้างและคุณสมบัติของวัตถุ วัตถุแห่งการรับรู้ทางสายตา ได้แก่ วัตถุ กระบวนการ และปรากฏการณ์ของโลกโดยรอบซึ่งสามารถแบ่งและอธิบายเป็นหมวดหมู่ของพื้นที่ การเคลื่อนไหว รูปร่าง พื้นผิว สี ความสว่าง เป็นต้น เมื่อรับรู้วัตถุภาพจะมากหรือน้อยเต็มที่ สะท้อนถึงวัตถุหรือสถานการณ์ที่มีบุคคลอยู่

รูปภาพที่สร้างขึ้นบนพื้นฐานของการรับรู้ทางสายตามีพลังในการเชื่อมโยงมากกว่าคำพูด บางทีนั่นอาจเป็นเหตุผลว่าทำไมพวกมันถึงถูกเก็บไว้ในความทรงจำอย่างสมบูรณ์แบบ แม้จะดูภาพเขียนหลายพันภาพเพียงครั้งเดียว ผู้สังเกตการณ์ก็สามารถระบุได้อย่างถูกต้องประมาณ 90% ภาพที่เห็นเป็นพลาสติกมาก คุณสมบัตินี้แสดงให้เห็นความจริงที่ว่าในแง่ของภาพการเปลี่ยนแปลงอย่างรวดเร็วจากการประเมินสถานการณ์โดยทั่วไปไปเป็น การวิเคราะห์โดยละเอียดองค์ประกอบของมัน การเคลื่อนไหวของวัตถุประเภทต่างๆ ที่สะท้อนอยู่ในภาพ การเลื่อน การหมุน รวมถึงการขยาย การย่อขนาด การบิดเบือนเปอร์สเปคทีฟ และการทำให้เป็นมาตรฐาน ความสามารถในการยักย้ายที่แปลกประหลาดนี้ ระบบภาพช่วยให้คุณจินตนาการถึงสถานการณ์ทั้งในมุมมองตรงและมุมมองย้อนกลับ การจัดการภาพและความสมบูรณ์แบบเป็นวิธีที่สำคัญที่สุดในการรับรู้ที่มีประสิทธิผลและการคิดด้วยภาพ

การศึกษาจำนวนมากระบุว่าระบบการมองเห็นมีกลไกที่ทำให้เกิดภาพใหม่ ต้องขอบคุณพวกเขาที่ทำให้คนเราสามารถมองเห็นโลกได้ไม่เพียงแต่ตามความเป็นจริงเท่านั้น แต่ยังสามารถมองเห็นโลกได้ (หรือควร) อีกด้วย ซึ่งหมายความว่าภาพที่มี เงื่อนไขที่จำเป็นยิ่งกว่านั้น - เครื่องมือ กิจกรรมจิต- พวกมันเกี่ยวข้องโดยตรงมากกว่าสัญลักษณ์และคำพูดด้วย ล้อมรอบบุคคลความเป็นจริงตามวัตถุประสงค์ ภาพไม่เพียงแต่เป็นการไตร่ตรองเท่านั้น แต่ยังเป็นการสร้างความเป็นจริงขึ้นมาใหม่อีกด้วย ความจริงนี้สามารถสร้างขึ้นใหม่ได้ในรูปแบบ (หรือใกล้เคียงกัน) ซึ่งมีวัตถุนั้นมีอยู่จริง แต่การทำลายวัตถุหรือสถานการณ์และการสร้างเวอร์ชันใหม่หรือเวอร์ชันใหม่ก็เป็นไปได้เช่นกัน บนพื้นฐานของภาพนี้ เปลี่ยนไปเมื่อเปรียบเทียบกับความเป็นจริง บุคคลหนึ่งหันไปสู่ความเป็นจริงตามวัตถุประสงค์อีกครั้งและสร้างมันขึ้นมาใหม่ในตัวเขาเอง กิจกรรมภาคปฏิบัติ- เป็นไปไม่ได้ที่จะเตรียมผู้เชี่ยวชาญด้านการคิดอย่างสร้างสรรค์โดยไม่พัฒนาการนำเสนอจินตนาการและการคิดของเขา เครื่องมือสากลของแผนผังการฉายภาพให้ประโยชน์ที่จับต้องได้ในเรื่องนี้ หนึ่งใน เครื่องมือที่จำเป็นการสร้างแบบจำลองการฉายภาพซึ่งทำหน้าที่ในการสร้างการนำเสนอเชิงพื้นที่เป็นการตีความทางเรขาคณิต วัตถุประสงค์ของการตีความคือ โมเดลกราฟิกในรูปแบบการรวมกันของภาพวาด ไดอะแกรม ข้อความ ไดอะแกรม ฯลฯ แบบจำลองกราฟิกเกี่ยวข้องกับการแสดงข้อมูลในรูปแบบของชุดเครื่องมือ การแสดงกราฟิกข้อมูล: เส้น สัญลักษณ์ สัญลักษณ์ช่วยจำที่ใช้ตามกฎเกณฑ์ในการสร้างแบบจำลองกราฟิก เมื่อรับรู้ข้อมูลในรูปแบบนี้ จำเป็นต้องเข้าถึงพื้นที่ปฏิบัติการที่มีมิติสูงกว่าเมื่อรับรู้ข้อความ ระดับความแม่นยำเมื่อเปรียบเทียบวัตถุข้อมูลกับแบบจำลองนั้นขึ้นอยู่กับความสมบูรณ์ของข้อมูลเกี่ยวกับอุปกรณ์ฉายภาพที่เกิดขึ้นระหว่างการสร้างแบบจำลอง รูปที่ 2.1 แสดงหนึ่งในการจัดหมวดหมู่ที่เป็นไปได้ของโมเดลกราฟิก โมเดลรูปภาพ– โมเดลกราฟิกที่คอมไพล์โดยใช้เงื่อนไข ภาพกราฟิก(รูปสัญลักษณ์) แสดงถึงวัตถุ การกระทำ หรือเหตุการณ์ โมเดลเชิงอุดมคติ– แบบจำลองกราฟิกที่รวบรวมโดยใช้อุดมคติ – ป้ายเขียนธรรมดาที่แสดงถึงแนวคิด

ปัญหาประสิทธิผลของการถ่ายโอนและการดูดซึมข้อมูลถือเป็นหนึ่งในประเด็นหลักตลอดมา ทศวรรษที่ผ่านมา- วิธีการสื่อสารหลักในโลกในช่วงต้นศตวรรษที่ 21 คือการสร้างภาพข้อมูล (รูปแบบการส่งผ่านภาพ) ปริมาณมากที่สุดข้อมูล (ประมาณ 80–90%) ที่บุคคลรับรู้ด้วยสายตา “ความสำคัญที่โดดเด่นของระบบการมองเห็นสำหรับมนุษย์อธิบายได้จากข้อเท็จจริงที่ว่ามันเป็นแหล่งข้อมูลที่ทรงพลังที่สุดเกี่ยวกับโลกภายนอก มีระบบเรนจ์ไฟนนิ่งและประสาทสัมผัสสามมิติที่ยิ่งใหญ่ที่สุด”

ประสิทธิภาพ ความได้เปรียบ วิธีกราฟิกการส่งข้อมูลเมื่อเปรียบเทียบกับมอเตอร์หรือเสียง (รูปที่ 2.2) ก็คือ การรับรู้ทางสายตาข้อมูลที่ส่งโดยบุคคลและการสร้างภาพทางจิตโดยเขาเกิดขึ้นอย่างรวดเร็วจนบุคคลรับรู้ว่ากระบวนการนี้ "เกิดขึ้นทันที" สิ่งนี้อธิบายถึงผลกระทบของความพร้อมกันหรือความพร้อมกันโดยขึ้นอยู่กับคุณสมบัติของการรับรู้ข้อมูลของมนุษย์: สร้างขึ้น ภาพจิตเมื่อรับข้อมูลและโมเดลกราฟิกที่ส่งจะมีรูปแบบคล้ายกันมาก

ด้วยจำนวนข้อมูลที่สะสมเพิ่มขึ้น แม้ว่าจะใช้อัลกอริธึม Data Mining ที่ทรงพลังและหลากหลายเพียงใด ก็กลายเป็นเรื่องยากมากขึ้นที่จะ “แยกแยะ” และตีความผลลัพธ์ที่ได้รับ และอย่างที่คุณทราบ บทบัญญัติประการหนึ่งของ DM คือการค้นหาในทางปฏิบัติ รูปแบบที่เป็นประโยชน์- รูปแบบจะมีประโยชน์ในทางปฏิบัติได้ก็ต่อเมื่อสามารถกำหนดแนวคิดและทำความเข้าใจได้

วิธีการนำเสนอข้อมูลด้วยภาพหรือกราฟิก ได้แก่ กราฟ แผนภูมิ ตาราง รายงาน รายการ บล็อกไดอะแกรม, แผนที่ ฯลฯ

การสร้างภาพข้อมูลได้รับการมองว่าเป็นแบบดั้งเดิม ความช่วยเหลือเมื่อวิเคราะห์ข้อมูล แต่ตอนนี้การศึกษามากขึ้นเรื่อย ๆ บ่งชี้ถึงบทบาทที่เป็นอิสระ

วิธีการแบบดั้งเดิมการแสดงภาพสามารถค้นหาแอปพลิเคชันต่อไปนี้:

ให้ข้อมูลแก่ผู้ใช้ ในรูปแบบภาพ;

 อธิบายรูปแบบที่มีอยู่ในชุดข้อมูลต้นฉบับอย่างกระชับ

ลดขนาดหรือบีบอัดข้อมูล

กู้คืนช่องว่างในชุดข้อมูล

ค้นหาสัญญาณรบกวนและค่าผิดปกติในชุดข้อมูล

วิธีการแสดงภาพ

ยอมรับวิธีการถ่ายภาพ ขึ้นอยู่กับจำนวนการวัดที่ใช้

แบ่งออกเป็นสองกลุ่ม:

การนำเสนอข้อมูลในมิติเดียว สอง และสามมิติ

การนำเสนอข้อมูลในสี่มิติขึ้นไป

การแสดงข้อมูลในมิติ 4+

การแสดงข้อมูลในสี่มิติขึ้นไปไม่สามารถเข้าถึงได้ด้วยการรับรู้ของมนุษย์ อย่างไรก็พัฒนา วิธีการพิเศษเพื่อให้บุคคลสามารถแสดงและรับรู้ข้อมูลดังกล่าวได้

ที่สุด วิธีการที่ทราบการนำเสนอข้อมูลหลายมิติ:

พิกัดขนาน;

 "ใบหน้าของเชอร์นอฟ";

แผนภูมิเรดาร์

การแสดงลักษณะเชิงพื้นที่

พื้นที่การแสดงภาพแยกต่างหากคือ การแสดงภาพ

ลักษณะเชิงพื้นที่ของวัตถุ ในกรณีส่วนใหญ่ เงินดังกล่าวจะถูกจัดสรรไว้ในบัตร แต่ละภูมิภาคและกำหนดเป็นสีต่างๆ ขึ้นอยู่กับค่าของตัวบ่งชี้ที่วิเคราะห์



แผนที่ถูกนำเสนอเป็นส่วนต่อประสานกราฟิกที่แสดงข้อมูลในรูปแบบของภูมิทัศน์สามมิติของรูปร่างที่กำหนดและจัดตำแหน่งโดยพลการ (แผนภูมิแท่ง ซึ่งแต่ละแผนภูมิมีส่วนสูงและสีของแต่ละบุคคล) วิธีนี้ช่วยให้คุณแสดงลักษณะเชิงปริมาณและเชิงสัมพันธ์ของการมุ่งเน้นเชิงพื้นที่ได้อย่างชัดเจน

ข้อมูลและระบุแนวโน้มได้อย่างรวดเร็ว

กระบวนการขุดข้อมูล การวิเคราะห์ สาขาวิชา- คำชี้แจงของปัญหา การเตรียมข้อมูล

กระบวนการขุดข้อมูล ระยะเริ่มแรก

กระบวนการ DM ถือเป็นการสำรวจประเภทหนึ่ง เช่นเดียวกับการวิจัยอื่นๆ กระบวนการนี้ประกอบด้วยขั้นตอนบางอย่าง รวมถึงองค์ประกอบของการเปรียบเทียบ การพิมพ์ การจำแนกประเภท การทำให้เป็นภาพรวม นามธรรม และการทำซ้ำ

กระบวนการ DM เชื่อมโยงกับกระบวนการตัดสินใจอย่างแยกไม่ออก

กระบวนการ DM จะสร้างแบบจำลอง และกระบวนการตัดสินใจจะดำเนินการกับแบบจำลองนั้น

พิจารณากระบวนการ DM แบบดั้งเดิม ประกอบด้วยขั้นตอนต่อไปนี้:

การวิเคราะห์สาขาวิชา;

การชี้แจงปัญหา

การเตรียมข้อมูล

แบบจำลองอาคาร

การทดสอบและประเมินแบบจำลอง

การเลือกรุ่น;

การประยุกต์ใช้แบบจำลอง

การแก้ไขและการอัปเดตแบบจำลอง

ในการบรรยายนี้ เราจะดูรายละเอียดเกี่ยวกับสามขั้นตอนแรกของกระบวนการ Data Mining

ส่วนขั้นตอนที่เหลือจะมีการหารือในการบรรยายครั้งต่อไป

ขั้นตอนที่ 1 การวิเคราะห์โดเมน

ศึกษา- นี่คือกระบวนการรับรู้ของสาขาวิชา วัตถุ หรือปรากฏการณ์บางอย่างโดยมีวัตถุประสงค์เฉพาะ

กระบวนการวิจัยประกอบด้วยการสังเกตคุณสมบัติของวัตถุเพื่อระบุและประเมินความสัมพันธ์ตามธรรมชาติระหว่างตัวบ่งชี้คุณสมบัติเหล่านี้จากมุมมองของอาสาสมัครและนักวิจัยที่สำคัญ

แก้ไขปัญหาการพัฒนาใด ๆ ซอฟต์แวร์ควรเริ่มต้นด้วยการศึกษาสาขาวิชา

สาขาวิชา- เป็นพื้นที่แห่งความเป็นจริงที่จำกัดทางจิตใจซึ่งขึ้นอยู่กับคำอธิบายหรือการสร้างแบบจำลองและการวิจัย

สาขาวิชาประกอบด้วยวัตถุที่แตกต่างกันตามคุณสมบัติและอยู่ในความสัมพันธ์บางอย่างระหว่างกันหรือมีปฏิสัมพันธ์ในทางใดทางหนึ่ง

สาขาวิชา- นี่คือส่วนหนึ่ง โลกแห่งความจริงมันไม่มีที่สิ้นสุดและมีทั้งสองอย่าง

ข้อมูลที่มีนัยสำคัญและไม่มีนัยสำคัญจากมุมมองของการวิจัยที่กำลังดำเนินการ

ผู้วิจัยจะต้องสามารถระบุส่วนสำคัญได้ เช่น เมื่อจะแก้ปัญหา “ฉันควรกู้เงินดีไหม?” ข้อมูลทั้งหมดเกี่ยวกับ ความเป็นส่วนตัวลูกค้า โดยขึ้นอยู่กับว่าคู่สมรสมีงานทำหรือไม่ ลูกค้ามีบุตรที่ยังไม่บรรลุนิติภาวะ การศึกษาระดับใด เป็นต้น เพื่อแก้ไขปัญหาทางธนาคารอื่น ข้อมูลนี้จะไม่สำคัญอย่างยิ่ง ความมีสาระสำคัญของข้อมูลจึงขึ้นอยู่กับการเลือกสาขาวิชา

เทคนิคการทำแผนที่จิตและ การแสดงภาพมักจะเป็นพื้นฐานของกลยุทธ์การนำทางเมื่อตีความแผนที่ สำหรับบางคนสิ่งนี้อาจเป็นเรื่องง่าย สำหรับบางคนอาจยากกว่า แม้ว่าทักษะจะพัฒนาขึ้นด้วยประสบการณ์ก็ตาม คำอธิบายภาพเขียนในรูปแบบของข้อความที่เกี่ยวข้องกับ บางประเภทกีฬา มักใช้เพื่อช่วยให้ผู้เข้าร่วมสร้างภาพลักษณ์ที่สดใส สิ่งนี้ทำให้พวกเขาสามารถสร้างกลยุทธ์การรับมือที่เหมาะสมสำหรับผู้ที่มีแนวโน้มจะเป็นได้ สถานการณ์ที่ยากลำบาก สิ่งแวดล้อม- คำอธิบายภูมิประเทศมักใช้ในการปรับทิศทางโดยเป็นส่วนหนึ่งของการฝึกอบรมทางเทคนิค ตัวอย่างเช่น โค้ชหรือบุคคลอื่นขอให้ผู้นำทางนำเสนอแล้วอธิบายตำแหน่งของจุดควบคุมหรือจุดสังเกตหลักของส่วนเล็กๆ ของแผนที่ด้วยวาจา ที่ตั้งของด่านอยู่บนเนินที่มีหนองน้ำเล็กๆทางทิศตะวันออกเฉียงเหนือและทิศตะวันตกเฉียงใต้ เดือยยาวทอดยาวไปทางทิศตะวันตก และมีเนินเขาเล็ก ๆ ตั้งอยู่ทางทิศตะวันออกเฉียงเหนือ ทิศตะวันออก และทิศตะวันตกเฉียงใต้ ฐานบัญชาการตั้งอยู่บนเนินเขาใด ในทำนองเดียวกัน นักตะวันออกอาจฟังคำอธิบายของส่วนเล็กๆ ของแผนที่หรือตำแหน่งของจุดตรวจ แล้วลองจำลองคำอธิบายด้วยวาจา: เนินเขารูปทรงไส้กรอกมียอดเขาสองยอด โดยยอดเขาหนึ่งอยู่ที่ปลายแต่ละด้านของสันเขาแคบๆ ซึ่งตั้งอยู่ในทิศตะวันออก-ตะวันตก เทือกเขามีเนินสองเนินที่สร้างอานไว้ ระยะทางเท่ากันจากยอดเขา ทางตะวันตกเฉียงเหนือของอานมีหุบเขาสูงชัน ยอดเขาด้านทิศตะวันออกสูงกว่ายอดเขาทางทิศตะวันตกและมีความลาดชันทางทิศตะวันออก มีเดือยกว้างขนาดใหญ่ทอดไปทางทิศเหนือ และมีความลาดชันน้อยทางทิศใต้ ยอดเขาด้านตะวันตกมีความลาดเอียงเล็กน้อยไปทางทิศเหนือและทิศตะวันตก และมีเดือยบางยาวทอดยาวไปทางทิศใต้ ทั้งสองวิธีนี้ช่วยพัฒนาการรับรู้ทางสายตา ทักษะการมองเห็นเป็นพื้นฐานของการค้นหาเส้นทาง ความสามารถในการมองเห็นตำแหน่งของจุดควบคุมหรือพื้นที่เฉพาะของแผนที่ควรปรับปรุงด้วยประสบการณ์ อย่างไรก็ตาม การฝึกฝนไม่ควรจำกัดอยู่เพียงการฝึกฝนหรือการแข่งขัน มีโอกาสฝึกฝนอื่นๆ ทั้งในอาคารและนอกอาคาร ตัวอย่างเช่น ค่อยๆ เรียนรู้แผนที่ของพื้นที่ที่คุ้นเคยและไม่คุ้นเคย จากนั้นการแสดงภาพตำแหน่งของจุดควบคุมตามข้อมูลแผนที่อาจมาก่อนการเยี่ยมชมพื้นที่จริง บ่อยครั้งมากเมื่อพูดถึงตำแหน่งของจุดตรวจหรือส่วนแผนที่ คุณจะได้ยินจากนักสำรวจว่า "นั่นไม่ใช่สิ่งที่ฉันคาดหวังไว้" อีกวิธีหนึ่งที่นักตะวันออกบางคนใช้คือฝึกฝนบนภูมิประเทศที่คุ้นเคย วาดแผนที่ของพื้นที่อื่น และลองจินตนาการถึงมันในขณะที่คุณไป คุณสมบัติลักษณะภูมิทัศน์ที่ไม่คุ้นเคย นี่อาจดูค่อนข้างแปลกแต่ก็มาก การออกกำลังกายที่ดีเพื่อความเข้มข้น

“พวกเขาว่ากันว่าภาพหนึ่งภาพแทนคำพูดได้นับพันคำ และนี่เป็นเรื่องจริง ตราบใดที่ภาพนั้นดี” โบว์แมน

ด้วยจำนวนข้อมูลที่สะสมเพิ่มขึ้น แม้ว่าจะใช้อัลกอริธึม Data Mining ที่ทรงพลังและหลากหลายเพียงใด ก็กลายเป็นเรื่องยากมากขึ้นที่จะ “แยกแยะ” และตีความผลลัพธ์ที่ได้รับ และดังที่คุณทราบ หนึ่งในข้อกำหนดของ Data Mining คือการค้นหารูปแบบที่เป็นประโยชน์ในทางปฏิบัติ รูปแบบจะมีประโยชน์ในทางปฏิบัติได้ก็ต่อเมื่อสามารถกำหนดแนวคิดและทำความเข้าใจได้

ในปี 1987 ตามความคิดริเริ่มของ ACM SIGGRAPH IEEE Computer Society คณะกรรมการด้านเทคนิคของคอมพิวเตอร์กราฟิก เนื่องจากความต้องการใช้วิธีการ เครื่องมือ และเทคโนโลยีข้อมูลใหม่ งานที่เกี่ยวข้องในด้านการแสดงภาพจึงได้รับการกำหนดขึ้น

วิธีการนำเสนอข้อมูลด้วยภาพหรือกราฟิก ได้แก่ กราฟ แผนภูมิ ตาราง รายงาน รายการ แผนภาพบล็อก แผนที่ ฯลฯ

การแสดงภาพข้อมูลมักถูกมองว่าเป็นตัวช่วยในการวิเคราะห์ข้อมูล แต่ในปัจจุบัน มีการวิจัยมากขึ้นเรื่อยๆ ที่ชี้ให้เห็นถึงบทบาทที่เป็นอิสระของการแสดงภาพ

เทคนิคการถ่ายภาพแบบดั้งเดิมอาจมีการใช้งานดังต่อไปนี้:

นำเสนอข้อมูลแก่ผู้ใช้ในรูปแบบภาพ

อธิบายรูปแบบที่มีอยู่ในชุดข้อมูลดั้งเดิมอย่างกระชับ

ลดขนาดหรือบีบอัดข้อมูล

ซ่อมแซมช่องว่างในชุดข้อมูล

ค้นหาสัญญาณรบกวนและค่าผิดปกติในชุดข้อมูล

การแสดงเครื่องมือการทำเหมืองข้อมูล

อัลกอริธึมการขุดข้อมูลแต่ละอันใช้วิธีการสร้างภาพข้อมูลเฉพาะ ในการบรรยายครั้งก่อน เราได้ดูวิธีการทำเหมืองข้อมูลหลายวิธี ในการใช้วิธีการแต่ละวิธีหรือการใช้ซอฟต์แวร์นั้น เราได้รับวิชวลไลเซอร์บางตัวด้วยความช่วยเหลือซึ่งเราสามารถตีความผลลัพธ์ที่ได้รับอันเป็นผลมาจากการทำงานของวิธีการและอัลกอริธึมที่เกี่ยวข้อง

สำหรับแผนผังการตัดสินใจ นี่คือเครื่องมือสร้างภาพแผนผังการตัดสินใจ รายการกฎ และตารางฉุกเฉิน

สำหรับ โครงข่ายประสาทเทียมขึ้นอยู่กับเครื่องมือ ซึ่งอาจเป็นโทโพโลยีเครือข่าย กราฟแสดงขนาดข้อผิดพลาด ซึ่งสาธิตกระบวนการเรียนรู้

สำหรับบัตรโคโฮเนน: บัตรเข้าออก บัตรเฉพาะอื่นๆ

สำหรับ การถดถอยเชิงเส้นเส้นการถดถอยทำหน้าที่เป็นตัวแสดงภาพ

สำหรับการจัดกลุ่ม: เดนโดแกรม แผนภาพกระจาย

แผนภูมิกระจายและแผนภูมิมักใช้เพื่อประเมินประสิทธิภาพของวิธีการ

วิธีการนำเสนอหรือแสดงข้อมูลด้วยภาพทั้งหมดนี้สามารถทำหน้าที่อย่างใดอย่างหนึ่งต่อไปนี้:

เป็นภาพประกอบของการสร้างแบบจำลอง (เช่น การแสดงโครงสร้าง (กราฟ) ของโครงข่ายประสาทเทียม)

ช่วยตีความผลลัพธ์ที่ได้รับ

เป็นวิธีการประเมินคุณภาพของแบบจำลองที่สร้างขึ้น

รวมฟังก์ชันข้างต้น (แผนผังการตัดสินใจ, เดนโดรแกรม)

การแสดงแบบจำลองการขุดข้อมูล

ฟังก์ชันแรก (ภาพประกอบของการสร้างแบบจำลอง) คือการแสดงภาพของแบบจำลอง Data Mining มีหลายวิธีในการนำเสนอแบบจำลอง แต่การแสดงภาพกราฟิกให้ "คุณค่า" สูงสุดแก่ผู้ใช้ ในกรณีส่วนใหญ่ ผู้ใช้ไม่ใช่ผู้เชี่ยวชาญด้านการสร้างแบบจำลอง โดยส่วนใหญ่แล้วเขาเป็นผู้เชี่ยวชาญในสาขาวิชาของตน ดังนั้น โมเดล Data Mining ควรนำเสนอในภาษาที่เป็นธรรมชาติที่สุด หรืออย่างน้อยก็ประกอบด้วย ปริมาณขั้นต่ำองค์ประกอบทางคณิตศาสตร์และเทคนิคต่างๆ

ดังนั้นความพร้อมใช้งานจึงเป็นหนึ่งในคุณสมบัติหลักของโมเดล Data Mining อย่างไรก็ตาม ยังมีวิธีทั่วไปและง่ายที่สุดในการแสดงโมเดลเป็น "กล่องดำ" ในกรณีนี้ ผู้ใช้ไม่เข้าใจพฤติกรรมของโมเดลที่เขาใช้ อย่างไรก็ตาม แม้จะมีความเข้าใจผิด แต่เขาก็ได้ผลลัพธ์ - รูปแบบที่ระบุ ตัวอย่างคลาสสิกโมเดลดังกล่าวเป็นโมเดลโครงข่ายประสาทเทียม

อีกวิธีหนึ่งในการนำเสนอโมเดลคือการนำเสนอโดยใช้สัญชาตญาณ ในรูปแบบที่ชัดเจน- ในกรณีนี้ ผู้ใช้สามารถเข้าใจสิ่งที่เกิดขึ้น "ภายใน" โมเดลได้อย่างแท้จริง ด้วยวิธีนี้จึงเป็นไปได้ที่จะรับประกันการมีส่วนร่วมโดยตรงในกระบวนการนี้

โมเดลดังกล่าวเปิดโอกาสให้ผู้ใช้หารือหรืออธิบายตรรกะกับเพื่อนร่วมงาน ลูกค้า และผู้ใช้รายอื่น

การทำความเข้าใจโมเดลนำไปสู่การทำความเข้าใจเนื้อหา จากความเข้าใจทำให้ความมั่นใจในแบบจำลองเพิ่มขึ้น ตัวอย่างคลาสสิกคือแผนผังการตัดสินใจ แผนผังการตัดสินใจที่สร้างขึ้นช่วยเพิ่มความเข้าใจในแบบจำลองได้อย่างแท้จริง เช่น เครื่องมือขุดข้อมูลที่ใช้

นอกเหนือจากความเข้าใจแล้ว โมเดลดังกล่าวยังช่วยให้ผู้ใช้โต้ตอบกับโมเดล ถามคำถาม และรับคำตอบได้อีกด้วย ตัวอย่างของการโต้ตอบดังกล่าวคือเครื่องมือ what-if การใช้กล่องโต้ตอบ "ผู้ใช้ระบบ" ผู้ใช้สามารถทำความเข้าใจโมเดลได้

ตอนนี้เรามาดูฟังก์ชันที่ช่วยตีความและประเมินผลลัพธ์ของการสร้างแบบจำลอง Data Mining กันดีกว่า เหล่านี้คือกราฟ ไดอะแกรม ตาราง รายการ ฯลฯ ทุกประเภท

ตัวอย่างของเครื่องมือการแสดงภาพที่สามารถใช้ในการประเมินคุณภาพของแบบจำลอง ได้แก่ แผนภูมิกระจาย ตารางฉุกเฉิน และกราฟของการเปลี่ยนแปลงขนาดของข้อผิดพลาด

พล็อตกระจายคือกราฟความเบี่ยงเบนของค่าที่โมเดลทำนายจากค่าจริง ไดอะแกรมเหล่านี้ใช้สำหรับ ปริมาณต่อเนื่อง- การประเมินคุณภาพของแบบจำลองที่สร้างขึ้นด้วยสายตาสามารถทำได้เมื่อสิ้นสุดกระบวนการสร้างแบบจำลองเท่านั้น

ตารางฉุกเฉินใช้ในการประเมินผลการจำแนกประเภท ตารางดังกล่าวใช้สำหรับ วิธีการต่างๆการจำแนกประเภท เราได้ใช้มันในการบรรยายครั้งก่อนแล้ว การประเมินคุณภาพของแบบจำลองที่สร้างขึ้นจะทำได้เฉพาะเมื่อสิ้นสุดกระบวนการสร้างแบบจำลองเท่านั้น

กราฟแสดงการเปลี่ยนแปลงค่าความผิดพลาด- กราฟแสดงการเปลี่ยนแปลงขนาดของข้อผิดพลาดระหว่างการทำงานของแบบจำลอง ตัวอย่างเช่น ในระหว่างการทำงานของโครงข่ายประสาทเทียม ผู้ใช้สามารถสังเกตการเปลี่ยนแปลงข้อผิดพลาดในชุดการฝึกและการทดสอบ และหยุดการฝึกเพื่อป้องกัน "การฝึกมากเกินไป" ของเครือข่าย ที่นี่ คุณภาพของแบบจำลองและการเปลี่ยนแปลงสามารถประเมินได้โดยตรงในระหว่างกระบวนการสร้างแบบจำลอง

ตัวอย่างของเครื่องมือแสดงภาพที่ช่วยตีความผลลัพธ์ ได้แก่ เส้นแนวโน้มในการถดถอยเชิงเส้น แผนที่ Kohonen แผนภูมิกระจายในการวิเคราะห์คลัสเตอร์

วิธีการแสดงภาพ

วิธีการแสดงภาพ ขึ้นอยู่กับจำนวนการวัดที่ใช้ โดยทั่วไปจะแบ่งออกเป็นสองกลุ่ม:

การนำเสนอข้อมูลในมิติเดียว สอง และสามมิติ

การแสดงข้อมูลในสี่มิติขึ้นไป

การแสดงข้อมูลในมิติเดียว สอง และสามมิติ

วิธีการกลุ่มนี้รวมถึงวิธีการที่รู้จักกันดีในการแสดงข้อมูลที่สามารถเข้าถึงได้ จินตนาการของมนุษย์- เกือบใดก็ได้ เครื่องดนตรีที่ทันสมัยการทำเหมืองข้อมูลรวมถึงวิธีการแสดงภาพจากกลุ่มนี้

ขึ้นอยู่กับจำนวนมิติของการเป็นตัวแทน สิ่งเหล่านี้อาจมีวิธีดังต่อไปนี้:

การวัดแบบไม่แปรผันหรือ 1-D;

การวัดความแปรผันหรือ 2-D;

การวัดสามมิติหรือการฉายภาพหรือ 3-D

ควรสังเกตว่าดวงตาของมนุษย์รับรู้ข้อมูลแบบสองมิติโดยธรรมชาติมากที่สุด

เมื่อใช้การแสดงข้อมูลแบบสองและสามมิติ ผู้ใช้จะมีโอกาสเห็นรูปแบบของชุดข้อมูล:

โครงสร้างคลัสเตอร์และการกระจายอ็อบเจ็กต์ออกเป็นคลาสต่างๆ (เช่น ในแผนภาพกระจาย)

คุณสมบัติทอพอโลยี

การมีแนวโน้ม;

ข้อมูลเกี่ยวกับ ตำแหน่งสัมพัทธ์ข้อมูล;

การมีอยู่ของการพึ่งพาอื่นๆ ที่มีอยู่ในชุดข้อมูลที่กำลังศึกษา

หากชุดข้อมูลมีมากกว่าสามมิติ ตัวเลือกต่อไปนี้จะเป็นไปได้:

การใช้งาน วิธีการหลายตัวแปรการนำเสนอข้อมูล (จะกล่าวถึงด้านล่าง)

การลดขนาดเป็นการแสดงหนึ่ง สอง หรือสามมิติ มี วิธีต่างๆการลดขนาด หนึ่งในนั้นก็คือ การวิเคราะห์ปัจจัย- ถูกกล่าวถึงในการบรรยายครั้งก่อน แผนที่ Kohonen ที่จัดระเบียบตัวเองนั้นใช้เพื่อลดมิติข้อมูลและแสดงข้อมูลบนแผนที่สองมิติไปพร้อมๆ กัน

การแสดงข้อมูลในมิติ 4+

การแสดงข้อมูลในสี่มิติและอื่นๆ ไม่สามารถเข้าถึงได้ด้วยการรับรู้ของมนุษย์ อย่างไรก็ตาม มีการพัฒนาวิธีการพิเศษเพื่อให้บุคคลสามารถแสดงและรับรู้ข้อมูลดังกล่าวได้

วิธีการแสดงข้อมูลหลายมิติที่รู้จักกันดีที่สุด:

พิกัดคู่ขนาน

∙ "ใบหน้าของเชอร์นอฟ";

แผนภูมิเรดาร์

พิกัดขนาน

ในพิกัดคู่ขนาน ตัวแปรจะถูกเข้ารหัสในแนวนอน เส้นแนวตั้งจะกำหนดค่าของตัวแปร ตัวอย่างชุดข้อมูลที่นำเสนอใน พิกัดคาร์ทีเซียนและพิกัดคู่ขนานตามที่กำหนดในรูป 16.1. วิธีการแสดงข้อมูลหลายมิตินี้คิดค้นโดย Alfred Inselberg ในปี 1985