ข้อดีของการนำเสนอข้อมูลในรูปแบบภาพ วิธีการนำเสนอข้อมูลด้วยภาพ
2.1. ข้อดี รูปแบบภาพการนำเสนอข้อมูล
ภาษาวาจาและหมวดหมู่วาจามีวิธีดั้งเดิมอย่างยิ่งในการสร้างพื้นที่ ตีความ หรือทำอะไรบางอย่างกับพื้นที่นั้น เป้าหมายนี้ให้บริการโดยภาษาของภาพและระบบการรับรู้ด้วยความช่วยเหลือที่บุคคลสร้างภาพของความเป็นจริงโดยรอบและปรับทิศทางตัวเองในนั้น ระบบนี้เรียกว่าการรับรู้ การรับรู้ถูกกำหนดให้เป็นภาพองค์รวมที่สะท้อนถึงความสามัคคีของโครงสร้างและคุณสมบัติของวัตถุ วัตถุแห่งการรับรู้ทางสายตา ได้แก่ วัตถุ กระบวนการ และปรากฏการณ์ของโลกโดยรอบซึ่งสามารถแบ่งและอธิบายเป็นหมวดหมู่ของพื้นที่ การเคลื่อนไหว รูปร่าง พื้นผิว สี ความสว่าง เป็นต้น เมื่อรับรู้วัตถุภาพจะมากหรือน้อยเต็มที่ สะท้อนถึงวัตถุหรือสถานการณ์ที่มีบุคคลอยู่
รูปภาพที่สร้างขึ้นบนพื้นฐานของการรับรู้ทางสายตามีพลังในการเชื่อมโยงมากกว่าคำพูด บางทีนั่นอาจเป็นเหตุผลว่าทำไมพวกมันถึงถูกเก็บไว้ในความทรงจำอย่างสมบูรณ์แบบ แม้จะดูภาพเขียนหลายพันภาพเพียงครั้งเดียว ผู้สังเกตการณ์ก็สามารถระบุได้อย่างถูกต้องประมาณ 90% ภาพที่เห็นเป็นพลาสติกมาก คุณสมบัตินี้แสดงให้เห็นความจริงที่ว่าในแง่ของภาพการเปลี่ยนแปลงอย่างรวดเร็วจากการประเมินสถานการณ์โดยทั่วไปไปเป็น การวิเคราะห์โดยละเอียดองค์ประกอบของมัน การเคลื่อนไหวของวัตถุประเภทต่างๆ ที่สะท้อนอยู่ในภาพ การเลื่อน การหมุน รวมถึงการขยาย การย่อขนาด การบิดเบือนเปอร์สเปคทีฟ และการทำให้เป็นมาตรฐาน ความสามารถในการยักย้ายที่แปลกประหลาดนี้ ระบบภาพช่วยให้คุณจินตนาการถึงสถานการณ์ทั้งในมุมมองตรงและมุมมองย้อนกลับ การจัดการภาพและความสมบูรณ์แบบเป็นวิธีที่สำคัญที่สุดในการรับรู้ที่มีประสิทธิผลและการคิดด้วยภาพ
การศึกษาจำนวนมากระบุว่าระบบการมองเห็นมีกลไกที่ทำให้เกิดภาพใหม่ ต้องขอบคุณพวกเขาที่ทำให้คนเราสามารถมองเห็นโลกได้ไม่เพียงแต่ตามความเป็นจริงเท่านั้น แต่ยังสามารถมองเห็นโลกได้ (หรือควร) อีกด้วย ซึ่งหมายความว่าภาพที่มี เงื่อนไขที่จำเป็นยิ่งกว่านั้น - เครื่องมือ กิจกรรมจิต- พวกมันเกี่ยวข้องโดยตรงมากกว่าสัญลักษณ์และคำพูดด้วย ล้อมรอบบุคคลความเป็นจริงตามวัตถุประสงค์ ภาพไม่เพียงแต่เป็นการไตร่ตรองเท่านั้น แต่ยังเป็นการสร้างความเป็นจริงขึ้นมาใหม่อีกด้วย ความจริงนี้สามารถสร้างขึ้นใหม่ได้ในรูปแบบ (หรือใกล้เคียงกัน) ซึ่งมีวัตถุนั้นมีอยู่จริง แต่การทำลายวัตถุหรือสถานการณ์และการสร้างเวอร์ชันใหม่หรือเวอร์ชันใหม่ก็เป็นไปได้เช่นกัน บนพื้นฐานของภาพนี้ เปลี่ยนไปเมื่อเปรียบเทียบกับความเป็นจริง บุคคลหนึ่งหันไปสู่ความเป็นจริงตามวัตถุประสงค์อีกครั้งและสร้างมันขึ้นมาใหม่ในตัวเขาเอง กิจกรรมภาคปฏิบัติ- เป็นไปไม่ได้ที่จะเตรียมผู้เชี่ยวชาญด้านการคิดอย่างสร้างสรรค์โดยไม่พัฒนาการนำเสนอจินตนาการและการคิดของเขา เครื่องมือสากลของแผนผังการฉายภาพให้ประโยชน์ที่จับต้องได้ในเรื่องนี้ หนึ่งใน เครื่องมือที่จำเป็นการสร้างแบบจำลองการฉายภาพซึ่งทำหน้าที่ในการสร้างการนำเสนอเชิงพื้นที่เป็นการตีความทางเรขาคณิต วัตถุประสงค์ของการตีความคือ โมเดลกราฟิกในรูปแบบการรวมกันของภาพวาด ไดอะแกรม ข้อความ ไดอะแกรม ฯลฯ แบบจำลองกราฟิกเกี่ยวข้องกับการแสดงข้อมูลในรูปแบบของชุดเครื่องมือ การแสดงกราฟิกข้อมูล: เส้น สัญลักษณ์ สัญลักษณ์ช่วยจำที่ใช้ตามกฎเกณฑ์ในการสร้างแบบจำลองกราฟิก เมื่อรับรู้ข้อมูลในรูปแบบนี้ จำเป็นต้องเข้าถึงพื้นที่ปฏิบัติการที่มีมิติสูงกว่าเมื่อรับรู้ข้อความ ระดับความแม่นยำเมื่อเปรียบเทียบวัตถุข้อมูลกับแบบจำลองนั้นขึ้นอยู่กับความสมบูรณ์ของข้อมูลเกี่ยวกับอุปกรณ์ฉายภาพที่เกิดขึ้นระหว่างการสร้างแบบจำลอง รูปที่ 2.1 แสดงหนึ่งในการจัดหมวดหมู่ที่เป็นไปได้ของโมเดลกราฟิก โมเดลรูปภาพ– โมเดลกราฟิกที่คอมไพล์โดยใช้เงื่อนไข ภาพกราฟิก(รูปสัญลักษณ์) แสดงถึงวัตถุ การกระทำ หรือเหตุการณ์ โมเดลเชิงอุดมคติ– แบบจำลองกราฟิกที่รวบรวมโดยใช้อุดมคติ – ป้ายเขียนธรรมดาที่แสดงถึงแนวคิด
ปัญหาประสิทธิผลของการถ่ายโอนและการดูดซึมข้อมูลถือเป็นหนึ่งในประเด็นหลักตลอดมา ทศวรรษที่ผ่านมา- วิธีการสื่อสารหลักในโลกในช่วงต้นศตวรรษที่ 21 คือการสร้างภาพข้อมูล (รูปแบบการส่งผ่านภาพ) ปริมาณมากที่สุดข้อมูล (ประมาณ 80–90%) ที่บุคคลรับรู้ด้วยสายตา “ความสำคัญที่โดดเด่นของระบบการมองเห็นสำหรับมนุษย์อธิบายได้จากข้อเท็จจริงที่ว่ามันเป็นแหล่งข้อมูลที่ทรงพลังที่สุดเกี่ยวกับโลกภายนอก มีระบบเรนจ์ไฟนนิ่งและประสาทสัมผัสสามมิติที่ยิ่งใหญ่ที่สุด”
ประสิทธิภาพ ความได้เปรียบ วิธีกราฟิกการส่งข้อมูลเมื่อเปรียบเทียบกับมอเตอร์หรือเสียง (รูปที่ 2.2) ก็คือ การรับรู้ทางสายตาข้อมูลที่ส่งโดยบุคคลและการสร้างภาพทางจิตโดยเขาเกิดขึ้นอย่างรวดเร็วจนบุคคลรับรู้ว่ากระบวนการนี้ "เกิดขึ้นทันที" สิ่งนี้อธิบายถึงผลกระทบของความพร้อมกันหรือความพร้อมกันโดยขึ้นอยู่กับคุณสมบัติของการรับรู้ข้อมูลของมนุษย์: สร้างขึ้น ภาพจิตเมื่อรับข้อมูลและโมเดลกราฟิกที่ส่งจะมีรูปแบบคล้ายกันมาก
ด้วยจำนวนข้อมูลที่สะสมเพิ่มขึ้น แม้ว่าจะใช้อัลกอริธึม Data Mining ที่ทรงพลังและหลากหลายเพียงใด ก็กลายเป็นเรื่องยากมากขึ้นที่จะ “แยกแยะ” และตีความผลลัพธ์ที่ได้รับ และอย่างที่คุณทราบ บทบัญญัติประการหนึ่งของ DM คือการค้นหาในทางปฏิบัติ รูปแบบที่เป็นประโยชน์- รูปแบบจะมีประโยชน์ในทางปฏิบัติได้ก็ต่อเมื่อสามารถกำหนดแนวคิดและทำความเข้าใจได้
วิธีการนำเสนอข้อมูลด้วยภาพหรือกราฟิก ได้แก่ กราฟ แผนภูมิ ตาราง รายงาน รายการ บล็อกไดอะแกรม, แผนที่ ฯลฯ
การสร้างภาพข้อมูลได้รับการมองว่าเป็นแบบดั้งเดิม ความช่วยเหลือเมื่อวิเคราะห์ข้อมูล แต่ตอนนี้การศึกษามากขึ้นเรื่อย ๆ บ่งชี้ถึงบทบาทที่เป็นอิสระ
วิธีการแบบดั้งเดิมการแสดงภาพสามารถค้นหาแอปพลิเคชันต่อไปนี้:
ให้ข้อมูลแก่ผู้ใช้ ในรูปแบบภาพ;
อธิบายรูปแบบที่มีอยู่ในชุดข้อมูลต้นฉบับอย่างกระชับ
ลดขนาดหรือบีบอัดข้อมูล
กู้คืนช่องว่างในชุดข้อมูล
ค้นหาสัญญาณรบกวนและค่าผิดปกติในชุดข้อมูล
วิธีการแสดงภาพ
ยอมรับวิธีการถ่ายภาพ ขึ้นอยู่กับจำนวนการวัดที่ใช้
แบ่งออกเป็นสองกลุ่ม:
การนำเสนอข้อมูลในมิติเดียว สอง และสามมิติ
การนำเสนอข้อมูลในสี่มิติขึ้นไป
การแสดงข้อมูลในมิติ 4+
การแสดงข้อมูลในสี่มิติขึ้นไปไม่สามารถเข้าถึงได้ด้วยการรับรู้ของมนุษย์ อย่างไรก็พัฒนา วิธีการพิเศษเพื่อให้บุคคลสามารถแสดงและรับรู้ข้อมูลดังกล่าวได้
ที่สุด วิธีการที่ทราบการนำเสนอข้อมูลหลายมิติ:
พิกัดขนาน;
"ใบหน้าของเชอร์นอฟ";
แผนภูมิเรดาร์
การแสดงลักษณะเชิงพื้นที่
พื้นที่การแสดงภาพแยกต่างหากคือ การแสดงภาพ
ลักษณะเชิงพื้นที่ของวัตถุ ในกรณีส่วนใหญ่ เงินดังกล่าวจะถูกจัดสรรไว้ในบัตร แต่ละภูมิภาคและกำหนดเป็นสีต่างๆ ขึ้นอยู่กับค่าของตัวบ่งชี้ที่วิเคราะห์
แผนที่ถูกนำเสนอเป็นส่วนต่อประสานกราฟิกที่แสดงข้อมูลในรูปแบบของภูมิทัศน์สามมิติของรูปร่างที่กำหนดและจัดตำแหน่งโดยพลการ (แผนภูมิแท่ง ซึ่งแต่ละแผนภูมิมีส่วนสูงและสีของแต่ละบุคคล) วิธีนี้ช่วยให้คุณแสดงลักษณะเชิงปริมาณและเชิงสัมพันธ์ของการมุ่งเน้นเชิงพื้นที่ได้อย่างชัดเจน
ข้อมูลและระบุแนวโน้มได้อย่างรวดเร็ว
กระบวนการขุดข้อมูล การวิเคราะห์ สาขาวิชา- คำชี้แจงของปัญหา การเตรียมข้อมูล
กระบวนการขุดข้อมูล ระยะเริ่มแรก
กระบวนการ DM ถือเป็นการสำรวจประเภทหนึ่ง เช่นเดียวกับการวิจัยอื่นๆ กระบวนการนี้ประกอบด้วยขั้นตอนบางอย่าง รวมถึงองค์ประกอบของการเปรียบเทียบ การพิมพ์ การจำแนกประเภท การทำให้เป็นภาพรวม นามธรรม และการทำซ้ำ
กระบวนการ DM เชื่อมโยงกับกระบวนการตัดสินใจอย่างแยกไม่ออก
กระบวนการ DM จะสร้างแบบจำลอง และกระบวนการตัดสินใจจะดำเนินการกับแบบจำลองนั้น
พิจารณากระบวนการ DM แบบดั้งเดิม ประกอบด้วยขั้นตอนต่อไปนี้:
การวิเคราะห์สาขาวิชา;
การชี้แจงปัญหา
การเตรียมข้อมูล
แบบจำลองอาคาร
การทดสอบและประเมินแบบจำลอง
การเลือกรุ่น;
การประยุกต์ใช้แบบจำลอง
การแก้ไขและการอัปเดตแบบจำลอง
ในการบรรยายนี้ เราจะดูรายละเอียดเกี่ยวกับสามขั้นตอนแรกของกระบวนการ Data Mining
ส่วนขั้นตอนที่เหลือจะมีการหารือในการบรรยายครั้งต่อไป
ขั้นตอนที่ 1 การวิเคราะห์โดเมน
ศึกษา- นี่คือกระบวนการรับรู้ของสาขาวิชา วัตถุ หรือปรากฏการณ์บางอย่างโดยมีวัตถุประสงค์เฉพาะ
กระบวนการวิจัยประกอบด้วยการสังเกตคุณสมบัติของวัตถุเพื่อระบุและประเมินความสัมพันธ์ตามธรรมชาติระหว่างตัวบ่งชี้คุณสมบัติเหล่านี้จากมุมมองของอาสาสมัครและนักวิจัยที่สำคัญ
แก้ไขปัญหาการพัฒนาใด ๆ ซอฟต์แวร์ควรเริ่มต้นด้วยการศึกษาสาขาวิชา
สาขาวิชา- เป็นพื้นที่แห่งความเป็นจริงที่จำกัดทางจิตใจซึ่งขึ้นอยู่กับคำอธิบายหรือการสร้างแบบจำลองและการวิจัย
สาขาวิชาประกอบด้วยวัตถุที่แตกต่างกันตามคุณสมบัติและอยู่ในความสัมพันธ์บางอย่างระหว่างกันหรือมีปฏิสัมพันธ์ในทางใดทางหนึ่ง
สาขาวิชา- นี่คือส่วนหนึ่ง โลกแห่งความจริงมันไม่มีที่สิ้นสุดและมีทั้งสองอย่าง
ข้อมูลที่มีนัยสำคัญและไม่มีนัยสำคัญจากมุมมองของการวิจัยที่กำลังดำเนินการ
ผู้วิจัยจะต้องสามารถระบุส่วนสำคัญได้ เช่น เมื่อจะแก้ปัญหา “ฉันควรกู้เงินดีไหม?” ข้อมูลทั้งหมดเกี่ยวกับ ความเป็นส่วนตัวลูกค้า โดยขึ้นอยู่กับว่าคู่สมรสมีงานทำหรือไม่ ลูกค้ามีบุตรที่ยังไม่บรรลุนิติภาวะ การศึกษาระดับใด เป็นต้น เพื่อแก้ไขปัญหาทางธนาคารอื่น ข้อมูลนี้จะไม่สำคัญอย่างยิ่ง ความมีสาระสำคัญของข้อมูลจึงขึ้นอยู่กับการเลือกสาขาวิชา
เทคนิคการทำแผนที่จิตและ การแสดงภาพมักจะเป็นพื้นฐานของกลยุทธ์การนำทางเมื่อตีความแผนที่ สำหรับบางคนสิ่งนี้อาจเป็นเรื่องง่าย สำหรับบางคนอาจยากกว่า แม้ว่าทักษะจะพัฒนาขึ้นด้วยประสบการณ์ก็ตาม คำอธิบายภาพเขียนในรูปแบบของข้อความที่เกี่ยวข้องกับ บางประเภทกีฬา มักใช้เพื่อช่วยให้ผู้เข้าร่วมสร้างภาพลักษณ์ที่สดใส สิ่งนี้ทำให้พวกเขาสามารถสร้างกลยุทธ์การรับมือที่เหมาะสมสำหรับผู้ที่มีแนวโน้มจะเป็นได้ สถานการณ์ที่ยากลำบาก สิ่งแวดล้อม- คำอธิบายภูมิประเทศมักใช้ในการปรับทิศทางโดยเป็นส่วนหนึ่งของการฝึกอบรมทางเทคนิค ตัวอย่างเช่น โค้ชหรือบุคคลอื่นขอให้ผู้นำทางนำเสนอแล้วอธิบายตำแหน่งของจุดควบคุมหรือจุดสังเกตหลักของส่วนเล็กๆ ของแผนที่ด้วยวาจา ที่ตั้งของด่านอยู่บนเนินที่มีหนองน้ำเล็กๆทางทิศตะวันออกเฉียงเหนือและทิศตะวันตกเฉียงใต้ เดือยยาวทอดยาวไปทางทิศตะวันตก และมีเนินเขาเล็ก ๆ ตั้งอยู่ทางทิศตะวันออกเฉียงเหนือ ทิศตะวันออก และทิศตะวันตกเฉียงใต้ ฐานบัญชาการตั้งอยู่บนเนินเขาใด ในทำนองเดียวกัน นักตะวันออกอาจฟังคำอธิบายของส่วนเล็กๆ ของแผนที่หรือตำแหน่งของจุดตรวจ แล้วลองจำลองคำอธิบายด้วยวาจา: เนินเขารูปทรงไส้กรอกมียอดเขาสองยอด โดยยอดเขาหนึ่งอยู่ที่ปลายแต่ละด้านของสันเขาแคบๆ ซึ่งตั้งอยู่ในทิศตะวันออก-ตะวันตก เทือกเขามีเนินสองเนินที่สร้างอานไว้ ระยะทางเท่ากันจากยอดเขา ทางตะวันตกเฉียงเหนือของอานมีหุบเขาสูงชัน ยอดเขาด้านทิศตะวันออกสูงกว่ายอดเขาทางทิศตะวันตกและมีความลาดชันทางทิศตะวันออก มีเดือยกว้างขนาดใหญ่ทอดไปทางทิศเหนือ และมีความลาดชันน้อยทางทิศใต้ ยอดเขาด้านตะวันตกมีความลาดเอียงเล็กน้อยไปทางทิศเหนือและทิศตะวันตก และมีเดือยบางยาวทอดยาวไปทางทิศใต้ ทั้งสองวิธีนี้ช่วยพัฒนาการรับรู้ทางสายตา ทักษะการมองเห็นเป็นพื้นฐานของการค้นหาเส้นทาง ความสามารถในการมองเห็นตำแหน่งของจุดควบคุมหรือพื้นที่เฉพาะของแผนที่ควรปรับปรุงด้วยประสบการณ์ อย่างไรก็ตาม การฝึกฝนไม่ควรจำกัดอยู่เพียงการฝึกฝนหรือการแข่งขัน มีโอกาสฝึกฝนอื่นๆ ทั้งในอาคารและนอกอาคาร ตัวอย่างเช่น ค่อยๆ เรียนรู้แผนที่ของพื้นที่ที่คุ้นเคยและไม่คุ้นเคย จากนั้นการแสดงภาพตำแหน่งของจุดควบคุมตามข้อมูลแผนที่อาจมาก่อนการเยี่ยมชมพื้นที่จริง บ่อยครั้งมากเมื่อพูดถึงตำแหน่งของจุดตรวจหรือส่วนแผนที่ คุณจะได้ยินจากนักสำรวจว่า "นั่นไม่ใช่สิ่งที่ฉันคาดหวังไว้" อีกวิธีหนึ่งที่นักตะวันออกบางคนใช้คือฝึกฝนบนภูมิประเทศที่คุ้นเคย วาดแผนที่ของพื้นที่อื่น และลองจินตนาการถึงมันในขณะที่คุณไป คุณสมบัติลักษณะภูมิทัศน์ที่ไม่คุ้นเคย นี่อาจดูค่อนข้างแปลกแต่ก็มาก การออกกำลังกายที่ดีเพื่อความเข้มข้น
“พวกเขาว่ากันว่าภาพหนึ่งภาพแทนคำพูดได้นับพันคำ และนี่เป็นเรื่องจริง ตราบใดที่ภาพนั้นดี” โบว์แมน
ด้วยจำนวนข้อมูลที่สะสมเพิ่มขึ้น แม้ว่าจะใช้อัลกอริธึม Data Mining ที่ทรงพลังและหลากหลายเพียงใด ก็กลายเป็นเรื่องยากมากขึ้นที่จะ “แยกแยะ” และตีความผลลัพธ์ที่ได้รับ และดังที่คุณทราบ หนึ่งในข้อกำหนดของ Data Mining คือการค้นหารูปแบบที่เป็นประโยชน์ในทางปฏิบัติ รูปแบบจะมีประโยชน์ในทางปฏิบัติได้ก็ต่อเมื่อสามารถกำหนดแนวคิดและทำความเข้าใจได้
ในปี 1987 ตามความคิดริเริ่มของ ACM SIGGRAPH IEEE Computer Society คณะกรรมการด้านเทคนิคของคอมพิวเตอร์กราฟิก เนื่องจากความต้องการใช้วิธีการ เครื่องมือ และเทคโนโลยีข้อมูลใหม่ งานที่เกี่ยวข้องในด้านการแสดงภาพจึงได้รับการกำหนดขึ้น
วิธีการนำเสนอข้อมูลด้วยภาพหรือกราฟิก ได้แก่ กราฟ แผนภูมิ ตาราง รายงาน รายการ แผนภาพบล็อก แผนที่ ฯลฯ
การแสดงภาพข้อมูลมักถูกมองว่าเป็นตัวช่วยในการวิเคราะห์ข้อมูล แต่ในปัจจุบัน มีการวิจัยมากขึ้นเรื่อยๆ ที่ชี้ให้เห็นถึงบทบาทที่เป็นอิสระของการแสดงภาพ
เทคนิคการถ่ายภาพแบบดั้งเดิมอาจมีการใช้งานดังต่อไปนี้:
∙ นำเสนอข้อมูลแก่ผู้ใช้ในรูปแบบภาพ
∙ อธิบายรูปแบบที่มีอยู่ในชุดข้อมูลดั้งเดิมอย่างกระชับ
∙ ลดขนาดหรือบีบอัดข้อมูล
∙ ซ่อมแซมช่องว่างในชุดข้อมูล
∙ ค้นหาสัญญาณรบกวนและค่าผิดปกติในชุดข้อมูล
การแสดงเครื่องมือการทำเหมืองข้อมูล
อัลกอริธึมการขุดข้อมูลแต่ละอันใช้วิธีการสร้างภาพข้อมูลเฉพาะ ในการบรรยายครั้งก่อน เราได้ดูวิธีการทำเหมืองข้อมูลหลายวิธี ในการใช้วิธีการแต่ละวิธีหรือการใช้ซอฟต์แวร์นั้น เราได้รับวิชวลไลเซอร์บางตัวด้วยความช่วยเหลือซึ่งเราสามารถตีความผลลัพธ์ที่ได้รับอันเป็นผลมาจากการทำงานของวิธีการและอัลกอริธึมที่เกี่ยวข้อง
∙ สำหรับแผนผังการตัดสินใจ นี่คือเครื่องมือสร้างภาพแผนผังการตัดสินใจ รายการกฎ และตารางฉุกเฉิน
∙ สำหรับ โครงข่ายประสาทเทียมขึ้นอยู่กับเครื่องมือ ซึ่งอาจเป็นโทโพโลยีเครือข่าย กราฟแสดงขนาดข้อผิดพลาด ซึ่งสาธิตกระบวนการเรียนรู้
∙ สำหรับบัตรโคโฮเนน: บัตรเข้าออก บัตรเฉพาะอื่นๆ
∙ สำหรับ การถดถอยเชิงเส้นเส้นการถดถอยทำหน้าที่เป็นตัวแสดงภาพ
∙ สำหรับการจัดกลุ่ม: เดนโดแกรม แผนภาพกระจาย
แผนภูมิกระจายและแผนภูมิมักใช้เพื่อประเมินประสิทธิภาพของวิธีการ
วิธีการนำเสนอหรือแสดงข้อมูลด้วยภาพทั้งหมดนี้สามารถทำหน้าที่อย่างใดอย่างหนึ่งต่อไปนี้:
∙ เป็นภาพประกอบของการสร้างแบบจำลอง (เช่น การแสดงโครงสร้าง (กราฟ) ของโครงข่ายประสาทเทียม)
∙ ช่วยตีความผลลัพธ์ที่ได้รับ
∙ เป็นวิธีการประเมินคุณภาพของแบบจำลองที่สร้างขึ้น
∙ รวมฟังก์ชันข้างต้น (แผนผังการตัดสินใจ, เดนโดรแกรม)
การแสดงแบบจำลองการขุดข้อมูล
ฟังก์ชันแรก (ภาพประกอบของการสร้างแบบจำลอง) คือการแสดงภาพของแบบจำลอง Data Mining มีหลายวิธีในการนำเสนอแบบจำลอง แต่การแสดงภาพกราฟิกให้ "คุณค่า" สูงสุดแก่ผู้ใช้ ในกรณีส่วนใหญ่ ผู้ใช้ไม่ใช่ผู้เชี่ยวชาญด้านการสร้างแบบจำลอง โดยส่วนใหญ่แล้วเขาเป็นผู้เชี่ยวชาญในสาขาวิชาของตน ดังนั้น โมเดล Data Mining ควรนำเสนอในภาษาที่เป็นธรรมชาติที่สุด หรืออย่างน้อยก็ประกอบด้วย ปริมาณขั้นต่ำองค์ประกอบทางคณิตศาสตร์และเทคนิคต่างๆ
ดังนั้นความพร้อมใช้งานจึงเป็นหนึ่งในคุณสมบัติหลักของโมเดล Data Mining อย่างไรก็ตาม ยังมีวิธีทั่วไปและง่ายที่สุดในการแสดงโมเดลเป็น "กล่องดำ" ในกรณีนี้ ผู้ใช้ไม่เข้าใจพฤติกรรมของโมเดลที่เขาใช้ อย่างไรก็ตาม แม้จะมีความเข้าใจผิด แต่เขาก็ได้ผลลัพธ์ - รูปแบบที่ระบุ ตัวอย่างคลาสสิกโมเดลดังกล่าวเป็นโมเดลโครงข่ายประสาทเทียม
อีกวิธีหนึ่งในการนำเสนอโมเดลคือการนำเสนอโดยใช้สัญชาตญาณ ในรูปแบบที่ชัดเจน- ในกรณีนี้ ผู้ใช้สามารถเข้าใจสิ่งที่เกิดขึ้น "ภายใน" โมเดลได้อย่างแท้จริง ด้วยวิธีนี้จึงเป็นไปได้ที่จะรับประกันการมีส่วนร่วมโดยตรงในกระบวนการนี้
โมเดลดังกล่าวเปิดโอกาสให้ผู้ใช้หารือหรืออธิบายตรรกะกับเพื่อนร่วมงาน ลูกค้า และผู้ใช้รายอื่น
การทำความเข้าใจโมเดลนำไปสู่การทำความเข้าใจเนื้อหา จากความเข้าใจทำให้ความมั่นใจในแบบจำลองเพิ่มขึ้น ตัวอย่างคลาสสิกคือแผนผังการตัดสินใจ แผนผังการตัดสินใจที่สร้างขึ้นช่วยเพิ่มความเข้าใจในแบบจำลองได้อย่างแท้จริง เช่น เครื่องมือขุดข้อมูลที่ใช้
นอกเหนือจากความเข้าใจแล้ว โมเดลดังกล่าวยังช่วยให้ผู้ใช้โต้ตอบกับโมเดล ถามคำถาม และรับคำตอบได้อีกด้วย ตัวอย่างของการโต้ตอบดังกล่าวคือเครื่องมือ what-if การใช้กล่องโต้ตอบ "ผู้ใช้ระบบ" ผู้ใช้สามารถทำความเข้าใจโมเดลได้
ตอนนี้เรามาดูฟังก์ชันที่ช่วยตีความและประเมินผลลัพธ์ของการสร้างแบบจำลอง Data Mining กันดีกว่า เหล่านี้คือกราฟ ไดอะแกรม ตาราง รายการ ฯลฯ ทุกประเภท
ตัวอย่างของเครื่องมือการแสดงภาพที่สามารถใช้ในการประเมินคุณภาพของแบบจำลอง ได้แก่ แผนภูมิกระจาย ตารางฉุกเฉิน และกราฟของการเปลี่ยนแปลงขนาดของข้อผิดพลาด
พล็อตกระจายคือกราฟความเบี่ยงเบนของค่าที่โมเดลทำนายจากค่าจริง ไดอะแกรมเหล่านี้ใช้สำหรับ ปริมาณต่อเนื่อง- การประเมินคุณภาพของแบบจำลองที่สร้างขึ้นด้วยสายตาสามารถทำได้เมื่อสิ้นสุดกระบวนการสร้างแบบจำลองเท่านั้น
ตารางฉุกเฉินใช้ในการประเมินผลการจำแนกประเภท ตารางดังกล่าวใช้สำหรับ วิธีการต่างๆการจำแนกประเภท เราได้ใช้มันในการบรรยายครั้งก่อนแล้ว การประเมินคุณภาพของแบบจำลองที่สร้างขึ้นจะทำได้เฉพาะเมื่อสิ้นสุดกระบวนการสร้างแบบจำลองเท่านั้น
กราฟแสดงการเปลี่ยนแปลงค่าความผิดพลาด- กราฟแสดงการเปลี่ยนแปลงขนาดของข้อผิดพลาดระหว่างการทำงานของแบบจำลอง ตัวอย่างเช่น ในระหว่างการทำงานของโครงข่ายประสาทเทียม ผู้ใช้สามารถสังเกตการเปลี่ยนแปลงข้อผิดพลาดในชุดการฝึกและการทดสอบ และหยุดการฝึกเพื่อป้องกัน "การฝึกมากเกินไป" ของเครือข่าย ที่นี่ คุณภาพของแบบจำลองและการเปลี่ยนแปลงสามารถประเมินได้โดยตรงในระหว่างกระบวนการสร้างแบบจำลอง
ตัวอย่างของเครื่องมือแสดงภาพที่ช่วยตีความผลลัพธ์ ได้แก่ เส้นแนวโน้มในการถดถอยเชิงเส้น แผนที่ Kohonen แผนภูมิกระจายในการวิเคราะห์คลัสเตอร์
วิธีการแสดงภาพ
วิธีการแสดงภาพ ขึ้นอยู่กับจำนวนการวัดที่ใช้ โดยทั่วไปจะแบ่งออกเป็นสองกลุ่ม:
∙ การนำเสนอข้อมูลในมิติเดียว สอง และสามมิติ
∙ การแสดงข้อมูลในสี่มิติขึ้นไป
การแสดงข้อมูลในมิติเดียว สอง และสามมิติ
วิธีการกลุ่มนี้รวมถึงวิธีการที่รู้จักกันดีในการแสดงข้อมูลที่สามารถเข้าถึงได้ จินตนาการของมนุษย์- เกือบใดก็ได้ เครื่องดนตรีที่ทันสมัยการทำเหมืองข้อมูลรวมถึงวิธีการแสดงภาพจากกลุ่มนี้
ขึ้นอยู่กับจำนวนมิติของการเป็นตัวแทน สิ่งเหล่านี้อาจมีวิธีดังต่อไปนี้:
∙ การวัดแบบไม่แปรผันหรือ 1-D;
∙ การวัดความแปรผันหรือ 2-D;
∙ การวัดสามมิติหรือการฉายภาพหรือ 3-D
ควรสังเกตว่าดวงตาของมนุษย์รับรู้ข้อมูลแบบสองมิติโดยธรรมชาติมากที่สุด
เมื่อใช้การแสดงข้อมูลแบบสองและสามมิติ ผู้ใช้จะมีโอกาสเห็นรูปแบบของชุดข้อมูล:
∙ โครงสร้างคลัสเตอร์และการกระจายอ็อบเจ็กต์ออกเป็นคลาสต่างๆ (เช่น ในแผนภาพกระจาย)
∙ คุณสมบัติทอพอโลยี
∙ การมีแนวโน้ม;
∙ ข้อมูลเกี่ยวกับ ตำแหน่งสัมพัทธ์ข้อมูล;
∙ การมีอยู่ของการพึ่งพาอื่นๆ ที่มีอยู่ในชุดข้อมูลที่กำลังศึกษา
หากชุดข้อมูลมีมากกว่าสามมิติ ตัวเลือกต่อไปนี้จะเป็นไปได้:
∙ การใช้งาน วิธีการหลายตัวแปรการนำเสนอข้อมูล (จะกล่าวถึงด้านล่าง)
∙ การลดขนาดเป็นการแสดงหนึ่ง สอง หรือสามมิติ มี วิธีต่างๆการลดขนาด หนึ่งในนั้นก็คือ การวิเคราะห์ปัจจัย- ถูกกล่าวถึงในการบรรยายครั้งก่อน แผนที่ Kohonen ที่จัดระเบียบตัวเองนั้นใช้เพื่อลดมิติข้อมูลและแสดงข้อมูลบนแผนที่สองมิติไปพร้อมๆ กัน
การแสดงข้อมูลในมิติ 4+
การแสดงข้อมูลในสี่มิติและอื่นๆ ไม่สามารถเข้าถึงได้ด้วยการรับรู้ของมนุษย์ อย่างไรก็ตาม มีการพัฒนาวิธีการพิเศษเพื่อให้บุคคลสามารถแสดงและรับรู้ข้อมูลดังกล่าวได้
วิธีการแสดงข้อมูลหลายมิติที่รู้จักกันดีที่สุด:
∙ พิกัดคู่ขนาน
∙ "ใบหน้าของเชอร์นอฟ";
∙ แผนภูมิเรดาร์
พิกัดขนาน
ในพิกัดคู่ขนาน ตัวแปรจะถูกเข้ารหัสในแนวนอน เส้นแนวตั้งจะกำหนดค่าของตัวแปร ตัวอย่างชุดข้อมูลที่นำเสนอใน พิกัดคาร์ทีเซียนและพิกัดคู่ขนานตามที่กำหนดในรูป 16.1. วิธีการแสดงข้อมูลหลายมิตินี้คิดค้นโดย Alfred Inselberg ในปี 1985