กระบวนการวิทยาการข้อมูล(data science process)
เป็นการดำเนินการตามกระบวนการของวิทยาการข้อมูลที่ระบุขั้นตอนสำคัญต่างๆที่ประกอบด้วย
ขั้นตอนที่ 1.การตั้งคำถาม(ask an interesting question) -ตั้งคำถามที่ตนเองสนใจ
ข้ันตอนที่ 2.การเก็บรวบรวมข้อมูล(get the data) -ต้องคำนึงถึงว่าจะเก็บข้อมูลเรื่องอะไร จากที่ไหน จำนวนเท่าใด และความน่าเชื่อถือของแหล่งข้อมูลข้อมูลที่เก็บรวบรวมได้จะต้องทำการตรวจสอบ ขจัดข้อมูลที่ผิด หรือข้อมูลที่ไม่สมบูรณ์ เพื่อให้ได้ข้อมูลนำเข้าที่ดี ไปสู่ผลลัพธ์ที่ดี
ขั้นตอนที่ 3. การสำรวจข้อมูล(explore the data) -เป็นการทำความเข้าใจรูปแบบ และค่าของข้อมูล แล้วนำข้อมูลที่รวบรวมมาพล็อต(plot) ทำให้เป็นภาพ (visualizations) หรือแผนภูมิ (charts) เพื่อให้มองเห็นความหมายที่ซ่อนเร้นอยู่ในข้อมูลผ่านกราฟ ซึ่งอาจพบความผิดปกติของข้อมูลได้
ขั้นตอนที่ 4.การวิเคราะห์ข้อมูล(analyze the data) -เพื่ออธิบายความหมาย ความสัมพันธ์ของข้อมูล และทำนายเหตุการณ์ที่จะเกิดขึ้นในอนาคต
ขั้นตอนที่ 5. การสื่อสารและการทำผลลัพธ์ให้เป็นภาพ (communicate and visualize the results) -เป็นการสื่อสารผลลัพธ์ของข้อมูลโดยการถ่ายทอดเป็นเรื่องราวหรือเป็นภาพให้ผู้อื่นเข้าใจว่าเราได้เรียนรู้อะไรจากข้อมูล
ไม่มีความคิดเห็น:
แสดงความคิดเห็น