การเก็บ และ สร้าง ฐานข้อมูล Twitter Search สำหรับ Data Mining

Posted on พฤศจิกายน 16, 2009

2


หลายคน คงเคยใช้ search.twitter.com นะครับ (ผมก็เคยลงบทความ) ซึ่งทำให้เราสามารถ ค้นหา content หรือ สิ่งที่คนกำลังพูดกันอยู่ครับ ซึ่ง ข้อมูลเหล่านี้เป็นประโยชน์อย่างมากสำหรับงาน Data Mining สำหรับ Marketing แต่ทว่าสำหรับ search twitter แล้ว สามารถค้นหาข้อมูลได้อย่างมาก แค่ 1 เดือนเท่านั้น ซึ่งอาจเป็นปัญหาสำหรับการ สร้างฐานข้อมูล สำหรับ Data Mining (แม้กระทั้งจะพัฒนา  API Search ด้วยตนเองแล้วก็ตาม)

ผมจะแนะนำ เครื่องมือตัวหนึ่งครับ เป็นการ Search ข้อมูล twitter ย้อนหลัง มาเก็บไว้ยังเครื่อง เราเลยครับ ซึ่งสามารถดูดข้อมูลย้อนหลังตาม Keyword ได้อย่างมากมายเลยครับ (เรื่อง Keyword หาอ่านในบทความ ย้อนหลังได้)  เครื่องมือนี้ ชื่อว่า Archivist สามารถไปตามลิงค์ ข้างล่างเลยครับ  ขอให้สนุกกับงานวิจัย นะครับ

http://flotzam.com/archivist/default.html

 

สำหรับ Mining Tools : แนะนำ Wega ครับ เป็น Open  Source

http://www.cs.waikato.ac.nz/ml/weka/

 

ต้องการรายละเอียดเพิ่มเติม สามารถ post มาถามได้ครับ

Advertisements
ติดป้ายกำกับ: , , , , ,