การแสดงข้อมูลข้อความคืออะไรและควรใช้เมื่อใด

เผยแพร่แล้ว: 2023-02-06

การดึงข้อมูลที่เกี่ยวข้องและจำเป็นออกจากเนื้อหาขนาดใหญ่มักจะเป็นงานที่ยุ่งยาก โดยเฉพาะอย่างยิ่งเมื่อข้อมูลขนาดใหญ่มีบทบาทสำคัญในการวิเคราะห์ข้อมูลในปัจจุบัน ไม่ว่าจะเป็นโพสต์บนโซเชียลมีเดียหรือคำติชมของลูกค้า บางครั้งข้อมูลที่ซับซ้อนจำนวนมากอาจทำให้ข้อมูลเฉพาะเจาะจงที่เราต้องการให้ความสำคัญ

ซึ่งจะต้องมีเครื่องมือในการสแกนข้อมูลเชิงคุณภาพสำหรับผลไม้แขวนต่ำ การทำเช่นนี้ด้วยตนเองนั้นไม่เป็นปัญหา และนี่คือขั้นตอนที่การแสดงข้อมูลข้อความเป็นขั้นตอนเข้ามา

ค้นพบวิธีที่การแสดงภาพข้อความจะระบุและเน้นข้อมูลสำคัญที่ฝังอยู่ในข้อมูลของคุณ และทำความเข้าใจว่าเครื่องมือแมชชีนเลิร์นนิงสามารถขยายการแสดงข้อมูลข้อความของคุณได้อย่างไร

การแสดงข้อความ101

การแสดงข้อความเป็นภาพเป็นวิธีนำเสนอข้อมูลในรูปแบบภาพ—เมฆคำ กราฟ แผนที่ เส้นเวลา เครือข่าย และอื่นๆ ทั้งหมดนี้สามารถใช้เพื่อแสดงภาพข้อมูลข้อความได้ การทำเช่นนี้จะช่วยให้เข้าใจโดยย่อเกี่ยวกับคำหลักที่สำคัญที่สุด รวมทั้งสรุปและสื่อสารถึงแนวโน้มและกรอบการทำงานภายในข้อความเฉพาะ

ด้วยเครื่องมือสร้างภาพข้อความดังกล่าว เราสามารถเข้าใจประเด็นหลักได้

การแสดงข้อความมีประโยชน์สำหรับ:

อัดแน่นเนื้อหา มากมาย ลดเวลาที่ใช้ในการอ่านโดยเน้นวลีสำคัญในข้อความต่างๆ จัดกลุ่มเนื้อหาตามหัวข้อ ความรู้สึก และอื่นๆ คุณนึกภาพออกไหมว่าต้องผ่านรีวิวจากลูกค้านับร้อย ด้วยเมฆคำหรือแผนภูมิแท่ง คุณสามารถแสดงภาพข้อมูลและเข้าใจสิ่งต่างๆ ได้ทันที

การทำให้ ข้อมูลข้อความง่าย ขึ้น สมองของเราเชื่อมต่อกับความเพลิดเพลินและทำความเข้าใจกับข้อมูลภาพ และได้รับการพิสูจน์แล้วว่าเราจัดเรียงภาพได้เร็วกว่าที่เราทำกับคำที่เขียน หากคุณต้องการลดความซับซ้อนของข้อมูลที่ซับซ้อนและถ่ายทอดแนวคิดเหล่านั้นไปยังผู้จัดการทีม การแสดงข้อความเป็นภาพคือหนทางที่จะไป

การกำหนดข้อมูลเชิงลึกในข้อมูลเชิงคุณภาพ ความคิดเห็นของลูกค้าอัดแน่นไปด้วยข้อมูลเชิงลึกที่ใช้ได้จริง คุณจะได้รับโครงร่างที่มีประสิทธิภาพของผลิตภัณฑ์ คุณลักษณะ และหัวเรื่องที่สำคัญที่สุดสำหรับลูกค้าของคุณ และโอกาสในการทำความเข้าใจไม่เพียงแต่ประเด็นปัญหาของพวกเขาเท่านั้น แต่ยังรวมถึงจุดที่คุณประสบความสำเร็จด้วย

ค้นพบแนวโน้มที่ซ่อนอยู่ ใช้การวิเคราะห์ข้อความและค่อยๆ แสดงข้อมูลเชิงลึกเพื่อให้มองเห็นความไม่สอดคล้องกันและหาสาเหตุหลักได้อย่างง่ายดาย

การขุดข้อความ

การเติบโตอย่างรวดเร็วของแพลตฟอร์มโซเชียลมีเดียและความพร้อมใช้งานของอินเทอร์เน็ตหมายความว่าปีแล้วปีเล่า ข้อมูลข้อความที่ไม่มีโครงสร้างจำนวนมากถูกสร้างขึ้นทุกปี และนั่นคือสิ่งที่การวิเคราะห์ข้อความเกี่ยวข้องกับการได้มาซึ่งข้อมูลเชิงลึกหรือการรวบรวมข้อมูลดิบนี้เพื่อขับเคลื่อนการวิจัย โครงการ ธุรกิจ และกิจกรรมอื่น ๆ ดังกล่าว

มีการวิจัยใหม่เกี่ยวกับการใช้เครื่องจักรเพื่อตรวจสอบข้อความ—การขุดข้อความ สิ่งนี้ตรงกันข้ามกับกระบวนการขุดข้อมูลที่ใช้ในวิทยาการคอมพิวเตอร์

การทำเหมืองข้อความมีจุดมุ่งหมายเพื่อค้นหารูปแบบทางสถิติในขณะที่ใช้เครื่องจักรเพื่อวิเคราะห์จุดข้อมูลในเนื้อหาที่มีข้อความจำนวนมาก ด้วยขั้นตอนนี้ รูปแบบต่างๆ ภายในระบบข้อมูลขนาดใหญ่จึงเริ่มปรากฏขึ้น

การขุดข้อความได้รับประโยชน์จากเครื่องมือสร้างภาพข้อความเนื่องจากอ่านง่ายสำหรับทั้งเครื่องและคน ข้อมูลส่วนที่สำคัญที่สุดจะถูกสื่อสารผ่านการแสดงภาพที่อ่านง่าย เช่น แผนภูมิแท่ง เมฆคำ กราฟ แผนที่ เส้นเวลา หรือเครือข่าย

เหตุใดการแสดงภาพข้อความจึงมีความจำเป็น

ทำให้เข้าใจข้อมูลข้อความได้ง่าย

คุณรู้หรือไม่ว่าสมองของคุณแยกแยะข้อมูลภาพได้เร็วกว่าคำพูดหรือตัวเลขถึง 60,000 เท่า การแสดงภาพข้อความทำให้ข้อมูลที่ซับซ้อนชัดเจนขึ้นและถ่ายทอดแนวคิดไปยังผู้จัดการทีมได้อย่างมีประสิทธิภาพ

สื่อสารสิ่งที่อยู่ในใจของผู้ชม

แผนภูมิสามารถช่วยให้คุณทราบได้ว่าผู้ฟังของคุณรู้สึกอย่างไรเกี่ยวกับเรื่องหรือประเด็นหนึ่งๆ แผนภูมินี้ยังสามารถใช้เพื่อย่อมุมมองที่ขับเคลื่อนด้วยข้อมูล ข้อมูลโดยตรงสามารถใช้เพื่อสรุปข้อเสนอแนะของตลาด

ย่อข้อความจำนวนมาก

ลดเวลาที่คุณใช้ในการอ่านข้อความจำนวนมาก เน้นคำศัพท์หลักในสตริงข้อความทันที จัดหมวดหมู่เนื้อหาตามหัวเรื่อง อารมณ์ความรู้สึก หรือธีมอื่นๆ

การสแกนอย่างรวดเร็วของการแสดงภาพข้อมูลข้อความหรือแดชบอร์ดจะอัปเดตคุณเกี่ยวกับข้อมูลสำคัญทั้งหมดที่คุณต้องการและจำเป็นต้องรู้

มันมีเสน่ห์

หากคุณดู word cloud คุณจะเห็นว่ามันทั้งสะดุดตาและให้ข้อมูล แผนภูมิที่ออกแบบมาอย่างดีสามารถใช้เพื่อเริ่มการสนทนาในหัวข้อที่น่าสนใจมากมาย

มันง่ายและตรงไปตรงมา

การสร้างและการอ่านการแสดงภาพข้อความนั้นค่อนข้างตรงไปตรงมา ไม่ว่าจะเป็นแผนภูมิแท่งหรือกราฟ คุณจะได้รับข้อมูลเชิงลึกที่นำไปใช้ได้จริงในชุดข้อมูลขนาดใหญ่

มาดูตัวอย่างที่มีประสิทธิภาพของการแสดงข้อมูลข้อความในส่วนต่อไปนี้

ตัวอย่างการแสดงข้อมูลข้อความ

ไม่ต้องสงสัยเลยว่าข้อมูลจะอ่านและเข้าใจได้ดีที่สุดเมื่อใช้รูปแบบภาพ การแปลงตารางที่หนาแน่นให้เป็นภาพที่ละเอียดและให้ข้อมูลนั้นต้องใช้ศิลปะ โดยเฉพาะอย่างยิ่งเมื่อไม่เพียงได้รับความรู้สึกของการวิเคราะห์เท่านั้น แต่ยังสื่อถึงผลกระทบที่แนวคิดหลักสามารถสร้างได้

มีการออกแบบการแสดงข้อความที่หลากหลาย นอกเหนือจากความถี่ทั่วไปหรือแผนภูมิการกระจาย ซึ่งคุณควรพิจารณา

เวิร์ดคลาวด์

เมฆคำคือการจัดกลุ่มของคำหลักหรือแท็กโดยใช้สีและขนาดตัวอักษรเฉพาะเพื่อสร้างการแสดงรูปร่างหรือตัวเลขที่คุณสามารถจดจำได้ง่าย

ถือว่าเป็นหนึ่งในเครื่องมือสร้างภาพข้อความที่ดึงดูดสายตา สร้างสรรค์ และมีประสิทธิภาพ สามารถเน้นความถี่ของคำได้โดยใช้ขนาดตัวอักษรและสีที่สะดุดตาเพื่อแสดงวลีเฉพาะเหล่านั้น ไม่น่าแปลกใจที่ word cloud มีบทบาทสำคัญไม่เพียงแต่ในการวิเคราะห์ข้อความเท่านั้น แต่ยังรวมถึงการศึกษาด้านมนุษยศาสตร์ดิจิทัลอีกด้วย

ด้วยการดูอย่างรวดเร็วเพียงครั้งเดียว ผู้อ่านสามารถระบุธีมและหัวเรื่องที่สำคัญได้ บล็อกและไซต์อื่นๆ ใช้ประโยชน์จากกลุ่มคำเพื่อสื่อสารแนวคิดกับผู้เยี่ยมชมได้ง่ายขึ้น และแหล่งข้อมูลที่เป็นนวัตกรรมนี้ถูกนำมาใช้ในวารสารศาสตร์ข้อมูลเพื่อเสริมข้อมูลที่เป็นข้อความในบทความข่าว

มีตัวอย่างที่ดีในบทความ ของ The New York Times เกี่ยวกับอัตราเงินเฟ้อของอเมริกา (Badger, E., Bhatia A. และ Bui Q. “Bacon, Gas and Essentials: Where 2,200 Americans Have Noticed Inflation.” The New York Times , 9 มีนาคม 2022) Word clouds ได้รับการออกแบบโดยใช้คำหรือวลีที่เกิดซ้ำมากที่สุด จากความคิดเห็นปลายเปิดของผู้เข้าร่วมการวิจัย

บทความแสดงให้เห็นว่าผู้เข้าร่วมจำนวนมากสังเกตเห็นอัตราเงินเฟ้อในผลิตภัณฑ์ส่วนใหญ่ แต่ที่พวกเขากังวลมากที่สุดคือก๊าซและอาหาร มีการใช้สีส้มใน word cloud เพื่อแสดงถึงประเภทอาหารและฉายแสงให้เห็นถึงความสำคัญของเรื่อง

รูปร่างและสีของ word cloud เล่นรองจากขนาดตัวอักษรที่เน้นความถี่ของคำ การนับอาจซับซ้อน ดังนั้นการแสดงข้อมูลข้อความนี้จึงใช้การเปลี่ยนแปลงขนาดตามความถี่ของคำทั้งหมด แทนที่จะใช้ความแปลกใหม่ของคำ

เครือข่าย

เครือข่ายแสดงความสัมพันธ์ระหว่างหน่วยต่างๆ ที่ประกอบกันเป็นเครือข่ายทั้งหมด การแสดงข้อมูลข้อความนี้มักใช้ในงานวรรณกรรมเพื่อสร้างเครือข่ายจากแง่มุมต่างๆ ของงานวรรณกรรม และเพื่อค้นหาความเชื่อมโยงระหว่างแง่มุมเหล่านั้นกับโครงสร้างของงาน

ในภาพนี้ เครือข่ายโครงสร้างแบบต้นไม้ถูกใช้เพื่อทำความเข้าใจข้อมูลข้อความจากส่วนที่หนึ่งของ Kerouac's On the Road ผู้อ่านเข้าใจแนวคิดหลักโดยมองข้ามการสร้างภาพ โดยการติดตามโครงสร้างแบบต้นไม้ ผู้อ่านจะเริ่มระบุว่าส่วนหนึ่งเกี่ยวข้องกับส่วนถัดไปอย่างไรโดยไม่ต้องอ่านเนื้อหา

อักษรศิลป์

ด้วย Word Art คุณสามารถสร้าง word clouds ของคุณเองจากเทมเพลตรูปภาพที่หลากหลาย นี่เป็นแหล่งข้อมูลที่ดีหากคุณต้องการสร้างสรรค์และสร้างสรรค์เมื่อออกแบบ word cloud คุณสามารถเลือกฟอนต์ ขนาด สไตล์ และเลย์เอาต์ของคุณ และเพิ่มคำลงในเครื่องมือสร้างได้โดยตรง

จัดเรียงเมฆ

Collocate clouds เป็นแท็กคลาวด์อีกประเภทหนึ่ง เป็นการแสดงข้อมูลข้อความสำหรับคำบางคำที่มักเกิดขึ้นพร้อมกัน (collocations) การแสดงภาพข้อมูลเหล่านี้ส่วนใหญ่พบในคลาสทั่วไปของปัญหา N-gram โดยที่ biggrams (สอง) และ trigrams (สาม) กลายเป็นเรื่องธรรมดามากขึ้นเรื่อยๆ

N-grams มีการใช้งานที่หลากหลายในด้านจีโนมิกส์ นอกจากนี้ยังนำไปใช้กับอัลกอริทึมที่เกี่ยวข้องกับการแก้ไขไวยากรณ์และการบีบอัดข้อความ ดูบิ๊กแกรมของการจับคู่คำที่เกิดขึ้นบ่อยที่สุดที่ระบุในชุดข้อมูล README

แผนภูมิความชัน

หากคุณต้องการเน้นการเปลี่ยนผ่าน ค่าสัมบูรณ์ การจัดอันดับ และการเปลี่ยนแปลงในระยะยาว แผนภูมิหรือกราฟความชันคือการแสดงข้อมูลข้อความที่เหมาะสม

ดูแผนภูมินี้ซึ่งสำรวจตัวแปรสำคัญที่เกี่ยวข้องกับจุดท่องเที่ยวในช่วงระยะเวลาหนึ่ง

แผนภูมิ/กราฟความชันเป็นตัวอย่างการแสดงภาพข้อความที่สมบูรณ์แบบเมื่อเปรียบเทียบช่วงเวลาหรือจุดอ้างอิงอื่นๆ และต้องการขีดเส้นใต้การเพิ่มขึ้นและลดลงในหมวดหมู่ต่างๆ ระหว่างจุดข้อมูลสองจุด

การสร้างแผนภูมิความลาดชันที่กระชับและแม่นยำต้องใช้ความอุตสาหะเนื่องจากไม่มีเทมเพลตที่ออกแบบไว้ล่วงหน้าให้ใช้งาน

ประเภทของข้อมูลที่คุณมีจะเป็นตัวกำหนดว่าแผนภูมิความชันจะเป็นเครื่องมือที่มีประสิทธิภาพหรือไม่ ตัวอย่างเช่น แผนภูมิของคุณจะไม่พิสูจน์ว่ามีประสิทธิภาพหากมีเส้นทับซ้อนกันหลายเส้น การแสดงภาพข้อความของคุณจะดูยุ่งเหยิงและความคิดของคุณจะหายไป

ข้อมูลที่สวยงามของคุณสมควรได้รับการออนไลน์

wpDataTables สามารถทำให้เป็นเช่นนั้นได้ มีเหตุผลที่ดีว่าทำไมปลั๊กอิน WordPress อันดับ 1 สำหรับการสร้างตารางและแผนภูมิที่ตอบสนอง

ตัวอย่างที่แท้จริงของ wpDataTables ในป่า

และมันง่ายมากที่จะทำสิ่งนี้:

  1. คุณให้ข้อมูลตาราง
  2. กำหนดค่าและปรับแต่ง
  3. เผยแพร่ในโพสต์หรือเพจ

และไม่ใช่แค่สวยเท่านั้น แต่ยังใช้งานได้จริงอีกด้วย คุณสามารถสร้างตารางขนาดใหญ่ที่มีแถวได้ถึงล้านแถว หรือจะใช้ตัวกรองและการค้นหาขั้นสูง หรือจะใช้ให้สุดโต่งและทำให้สามารถแก้ไขได้

“ใช่ แต่ฉันแค่ชอบ Excel มากเกินไป และไม่มีอะไรแบบนั้นบนเว็บไซต์” ใช่มี คุณสามารถใช้การจัดรูปแบบตามเงื่อนไขเช่นใน Excel หรือ Google ชีต

ฉันบอกคุณแล้วหรือยังว่าคุณสามารถสร้างแผนภูมิด้วยข้อมูลของคุณได้ และนั่นเป็นเพียงส่วนน้อยเท่านั้น มีคุณสมบัติอื่น ๆ อีกมากมายสำหรับคุณ

แผนภูมิ Sankey

ด้วยแผนภูมิ Sankey คุณจะเห็นภาพได้ว่าค่ากลุ่มหนึ่งไหลไปยังกลุ่มถัดไปอย่างไร จุดที่เชื่อมต่อกันทั้งสองนี้เรียกว่า 'โหนด' และการเชื่อมต่อนั้นเรียกว่า 'ลิงค์'

ไดอะแกรม Sankey ถูกนำมาใช้เพื่อสร้างการวิเคราะห์ภาพการไหลของพลังงานเป็นครั้งแรก แต่กลายเป็นเครื่องมือที่มีประสิทธิภาพในการทำความเข้าใจการไหลของเวลา เงิน และทรัพยากร การออกแบบโฟลวพร้อมแผนภูมิสามารถแสดงวัสดุ ของไหล รายได้ พลังงาน และต้นทุน

กระบวนการที่ซับซ้อนสามารถคลี่คลายได้โดยใช้การแสดงข้อมูลนี้ มันมุ่งเน้นไปที่องค์ประกอบหรือทรัพยากรเฉพาะที่คุณต้องเน้นและมีข้อได้เปรียบในการส่งเสริมระดับการรับชมที่หลากหลาย

หากคุณชอบอ่านบทความนี้เกี่ยวกับการแสดงข้อมูลข้อความ คุณควรอ่านสิ่งเหล่านี้ด้วย:

  • เครื่องมือสร้างภาพข้อมูลการสำรวจที่ดีที่สุดที่จะใช้
  • เหตุใดการแสดงข้อมูลตารางจึงมีประสิทธิภาพในการนำเสนอข้อมูล
  • อินโฟกราฟิกและการแสดงข้อมูล: ต่างกันอย่างไร