»
S
I
D
E
B
A
R
«
การประชุมวิชาการประจำปี 2554 STKS (ตอนที่ 8)
Jul 25th, 2011 by pornpan 272 views

หัวข้อเรื่อง ประสบการณ์การวิเคราะห์ข้อมูลด้วยวิธีการทำเหมืองข้อมูล (Text Mining) วิทยากรโดย ดร.อลิสา คงทน นักวิจัย ห้องปฏิบัติการวิจัยวิทยาการมนุษยภาษา ศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ สวทช.

การทำเหมือง  (Text Mining) หรือ การวิเคราะห์ข้อมูล เป็นการหาวิธีในการสกัดหาองค์ความรู้จากข้อมูล ด้วยเหตุผลที่ข้อมูลมีขนาดใหญ่และจำนวนมาก จะมีวิธีการสกัดหาองค์ความรู้ และใช้ประโยชน์จากข้อมูลได้อย่างไร การทำ Text Mining คือ นำความสามารถในการวิเคราะห์ภาษาของมนุษย์ (Natural Language Processing: NLP) และ ความสามารถของคอมพิวเตอร์ (Data Mining) ผนวกรวมเข้าด้วยกัน วิธีการทำ Text Mining มีหลายวิธี คือ
1. Information extraction: การสกัด วิเคราะห์ข้อความที่ไม่มีโครงสร้างออกมา แล้วนำไปวิเคราะห์
2. Topic detection and tracking: การค้นหาหัวข้อเรื่องที่สำคัญ
3. Summarization: การย่อความ ดึงประเด็นสำคัญออกมา
4. Categorization: การจัดหมวดหมู่ (ต้องมีหมวดหมู่เดิมไว้อยู่แล้ว)
5. Clustering: การจัดกลุ่มเอกสาร โดยที่ไม่ทราบหมวดหมู่ วิธีการจัดกลุ่มเอกสาร คือ จัดกลุ่มเอกสารที่มีคำสำคัญ (Keyword) ใกล้เคียงกัน ไว้ด้วยกัน
6. Concept linkage: หลังจากจัดกลุ่มเอกสารแล้ว พยายามหาความสำคัญของกรอบความคิด(Concept)
7. Information visualization: นำเสนอเอกสารที่วิเคราะห์ได้ในรูปกราฟิก แผนภูมิ ตาราง เพื่อให้เข้าใจง่าย
8. Question and anserwing (Q&A): พยายามสกัดหาคำตอบให้กับผู้ใช้

Application ของ Tech Mining ที่สำคัญคือ การประยุกต์ใช้ Text Mining เพื่อดูความสามารถด้าน S&T โดยดูจากข้อมูลรายการบรรณานุกรมและบทคัดย่อ (Bibliographic Abstract) เพื่อให้มองเห็นความสำคัญ Topic ไหนสำคัญ สามารถนำไปสู่ Technology Forecast ได้

กระบวนการทำงานของ Tech Mining มี 3 ส่วน คือ  Data – Software – TIP’s
Data ได้แก่ ฐานข้อมูลสิทธิบัตร และฐานข้อมูลผลงานตีพิมพ์งานวิจัยและพัฒนา
Software ได้แก่ โปรแกรมที่วิเคราะห์และนำเสนอข้อมูล
TIP’s (Technology Intelligence Products) เป็นการนำเสนอรายงานผลการวิเคราะห์ข้อมูล เพื่อการสนับสนุนการตัดสินใจ

Technical Intelligence: เป็นการย่อยข้อมูลจากหลายแหล่งข้อมูล เพื่อหารายละเอียดงานวิจัย 4 ด้าน สำคัญ คือ Who What When Where พร้อมจัดทำแผนที่แสดงความสัมพันธ์เชื่อมโยง และวิเคราะห์แนวโน้มเทคโนโลยี แสดงถึงหัวข้อเรื่องใดที่กำลังได้รับความสนใจ

Software เช่น Vantage Point วิเคราะห์ Bibliographic Abstract (R&D Publication) และข้อมูลสิทธิบัตร หากไม่มีโปรแกรมวิเคราะห์ข้อมูล ปัจจุบันฐานข้อมูลออนไลน์ชุดใหม่ เช่น ฐานข้อมูล Web of Science, ScienceDirect มีฟังก์ชันในการวิเคราะห์ข้อมูลเบื้องต้นอยู่แล้ว

ปัจจุบันทางห้องปฏิบัติการวิจัยวิทยาการมนุษยภาษา ศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ สวทช. ได้ทำงานวิจัย และประยุกต์ใช้เทคโนโลยี Text Mining เป็นต้นแบบงานวิจัย (Prototype) อยู่หลายเรื่อง เช่น
1. Expert Finder ระบบค้นหานักวิจัยไทย ผู้เชี่ยวชาญ เป็น Prototype ในงานวิจัย TNRR Expert Finder (Thai National Research Repository)
2. ABDUL (Artificial BudDy U Love) ระบบการค้นหาแหล่งข้อมูลออนไลน์ด้านต่าง ๆ เช่น พยากรณ์อากาศ ข้อมูลราคาหุ้น ข้อมูลสำหรับนักท่องเที่ยว อัตราแลกเปลี่ยนเงินตรา
3. Opinion Mining ระบบการแสดงความคิดเห็น เป็น Prototype กับ Hotel Reviewers

สรุป ปัจจุบันข้อมูลเพิ่มขึ้นทุกวัน เครื่องมือ (Tools) ในลักษณะ Text Mining ก็จะเข้ามามีบทบาทในการสกัดองค์ความรู้ และประยุกต์ใช้งานได้อีกมาก

Share
Bibliomining: การทำเหมืองข้อมูลในห้องสมุด
Feb 15th, 2009 by supaporn 1,421 views

ห้องสมุดดูจะห่างไกลจากการนำข้อมูลที่มีอยู่ไปวิเคราะห์เพื่อประโยชน์ของห้องสมุด คงเพราะมีงานประจำอยู่มากมายทำไม่หมดซะที แต่ถ้าหันกลับมามองว่า ข้อมูลต่างๆ ที่เก็บอยู่สามารถมาช่วยในการบริหารงานหรือการทำงานของห้องสมุดได้มากทีเดียว โดยเฉพาะปัจจุบันห้องสมุดโดยส่วนใหญ่ ขอหมายถึง ห้องสมุดสถาบันอุดมศึกษา มีการนำระบบห้องสมุดอัตโนมัติมาให้บริการแ่ก่ประชาคมของตน จริงๆ แล้ว เื้บื้องหลังของระบบจะเก็บข้อมูลต่างๆ ที่เกี่ยวข้องไว้เช่น รายละเอียดทรัพยากรสารสนเทศที่มีอยู่ ข้อมูลส่วนบุคคลของผู้ใช้บริการ บาร์โคดของทรัพยากรสารสนเทศที่ถูกยืม วันที่ยืม และวันที่ต้องคืน และบันทึกวันที่ผู้ใช้นำมาคืนด้วย ถ้านำกระบวนการ Bibilomining มาประยุกต์กับข้อมูลที่เก็บไว้ เพื่อค้นหาความสัมพันธ์ของหนังสือทีู่ถูกยืมกับผู้ยืม การยืมถูกแบ่งเป็นกี่กลุ่ม แต่ละกลุ่มเป็นนักศึกษาหรือนักวิจัย หรืออาจารย์จากภาควิชาใด คลัสเตอร์ใด ยืมหนังสือหมวดใด จะทำให้ห้องสมุดทราบความต้องการของผู้ยืมหนังสือ และใช้เป็นแนวทางในการจัดการและจัดซื้อหนังสือให้สอดคล้องกับความต้องการของผู้ยืมได้

อ้างอิง: ไพโรจน์ เอี่ยมชัยมงคล และ นันทิยา อักษรกิตติ์. 2552. “การประยุกต์กระบวนการ Bibliomining กรณีศึกษา หอสมุดมหาวิทยาลัยราชภัฏลำปาง”  วารสารวิจัย สมาคมห้องสมุดแห่งประเทศไทย 2,1 (ม.ค.-มิ.ย. 52) : 1-12.

Share
»  Substance: WordPress   »  Style: Ahren Ahimsa