บิ๊กดาต้า (big data) เติบโตขึ้นอย่างต่อเนื่องในแต่ละปีที่ผ่านมา ในปัจจุบันซึ่งเป็นยุคดิจิทัล การเติบโตของข้อมูลที่ถูกผลิตออกมาเพิ่มขึ้นทวีคูณอย่างเห็นได้ชัด โดย IDC คาดการณ์ว่าภายในปี 2525 ข้อมูลทั่วโลก 80% จะเป็นข้อมูลที่ไม่มีโครงสร้าง (Unstructured) ไม่ช้าหรือเร็ว ธุรกิจของคุณจำเป็นจะต้องมีการจัดการพื้นที่จัดเก็บข้อมูลส่วนกลาง (data lake) ขนาดใหญ่อย่างแน่นอน
หากนึกถึง data lake ให้นึกถึงพื้นที่ส่วนกลางที่เปรียบเสมือนทะเลกว้างสำหรับจัดเก็บข้อมูลของคุณ เป็นพื้นที่สำหรับการจัดเก็บข้อมูล ทั้งที่มีโครงสร้างข้อมูล (structured data) และไม่มีโครงสร้างข้อมูล (Unstructured Data) ไว้ในทุกขนาด
ข้อมูลต้นทางทั้งหมดจะถูกส่งเหมือนแม่น้ำที่ไหลสู่ทะเลพื้นที่ส่วนกลางของคุณ ซึ่งเป็นพื้นที่จัดเก็บข้อมูลดิบ ข้อมูลที่ยังไม่ได้คัดกรอง และข้อมูลอื่นๆ ที่อยู่ภายใต้การดูแลขององค์กร
ชุดข้อมูลเชิงโครงสร้าง (structured data) เป็นข้อมูลที่มาพร้อมกับโครงสร้างของตัวมันเอง โดยไม่จำเป็นต้องทำ การจัดทำดรรชนี (Indexing) หรือติดแท็ก (tagging) เพิ่มเติม ส่วนชุดข้อมูลที่ไม่มีโครงสร้างแน่นอน (unstructured data) เป็นข้อมูลที่มีรูปแบบดั้งเดิม เช่น โพสในโซเชียลมีเดีย รูปภาพ และไฟล์ MP3 เป็นต้น ซึ่งข้อมูลอย่างหลังนี้เองที่ทำให้ข้อมูลไม่เป็นระเบียบ
เมื่อข้อมูลต่างประเภทกันมาอยู่รวมกันเป็นจำนวนมาก การค้นหาข้อมูลอะไรสักอย่างที่ไม่เหมือนใครก็กลายเป็นเรื่องยาก ทั่วโลกในขณะนี้ ในหนึ่งคนก็จะมีอุปกรณ์อย่างน้อยสองชิ้น ซึ่งต่างก็สร้างข้อมูลจำนวนมหาศาลในทุกๆ วัน ดังนั้น พื้นที่จัดเก็บข้อมูลส่วนกลาง (data lake) ของคุณก็มีแต่จะกว้างและซับซ้อนขึ้น ไม่ลดน้อยลงไปกว่านี้
ในบางครั้ง data lake ก็สามารถถูกทำลายลงได้ด้วยน้ำหนักของตัวมันเองจากข้อมูลที่สะสมเอาไวมากเกินไป ซึ่งกรณีนี้จะเกิดขึ้นก็ต่อเมื่อเราปล่อยให้เวลาผ่านไปโดยที่ไม่มีการจัดทำดัชนีและการกำกับดูแลที่ชัดเจน
ในขณะที่การรวบรวมข้อมูลเป็นสิ่งสำคัญ แต่ก็เป็นเพียงส่วนหนึ่งของกระบวนการเท่านั้น เพราะคุณประโยชน์ที่แท้จริงจะเกิดขึ้นก็ต่อเมื่อข้อมูลถูกจัดการและรวมไว้ด้วยกัน
ข้อมูลจำเป็นจะต้องมีการจัดการรายการบัญชีข้อมูลและการจัดการการเข้าถึงเพื่อนำไปใช้งานได้ง่าย การค้นหาโดยไม่มีแนวทางที่ชัดเจนเป็นกระบวนการที่ไม่มีประสิทธิภาพและทำให้เสียเวลา สิ่งแรกที่ควรคำนึงก็คือการรวบรวมข้อมูลเข้าไว้ด้วยกันในพื้นที่จัดเก็บข้อมูลส่วนกลาง (data lake)
Data lake ที่มีการกำกับดูแลที่ดีจะ…
บัญชีข้อมูลจะช่วย…
พื้นที่จัดเก็บข้อมูลส่วนกลาง (data lake) สามารถเปลี่ยนภาระจากการเติบโตของข้อมูลแบบทวีคูณให้กลายเป็นข้อได้เปรียบแทน และหากมีการจัดการข้อมูลขององค์กรแบบบัญชีข้อมูล (data catalog) ก็จะเป็นตัวสร้างข้อมูลเชิงลึกที่สามารถนำไปใช้ประโยชน์ต่อได้
ในแต่ละวันที่ผ่านไป กระแสของข้อมูลที่ถาโถมเข้ามาในตัวจัดเก็บข้อมูลมีแต่จะเพิ่มขึ้นทุกที การกำกับดูแลจะช่วยลดความวุ่นวายด้วยการจัดลำดับ และทำให้แน่ใจว่าข้อมูลมีความถูกต้องและเป็นประโยชน์
บัญชีข้อมูล (data catalog) เป็นเครื่องมือที่ใช้งานง่าย สะดวก บริษัทต่างๆ ที่นำ IBM Watson Catalog ไปใช้กับพื้นที่เก็บข้อมูลส่วนกลาง (data lake) ทำให้พวกเขามีข้อมูลเป็นตัวขับเคลื่อนและพัฒนาองค์กรไปสู่ความสำเร็จได้ในอนาคต
เรียนรู้เพิ่มเติมเกี่ยวกับการปรับปรุงประสิทธิภาพการทำงานองค์กรของคุณ ด้วยการนำ IBM Watson Catalog ไปใช้กับพื้นที่จัดเก็บข้อมูลส่วนกลาง (Data lake) ของคุณในอนาคต ติดต่อพีเอ็มสแควร์ผู้เป็นพาร์ทเนอร์ทางธุรกิจระดับแพลทินัมของ IBM ได้แล้ววันนี้!
Cookie | Duration | Description |
---|---|---|
cookielawinfo-checkbox-analytics | 11 months | This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Analytics". |
cookielawinfo-checkbox-functional | 11 months | The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional". |
cookielawinfo-checkbox-necessary | 11 months | This cookie is set by GDPR Cookie Consent plugin. The cookies is used to store the user consent for the cookies in the category "Necessary". |
cookielawinfo-checkbox-others | 11 months | This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Other. |
cookielawinfo-checkbox-performance | 11 months | This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance". |
viewed_cookie_policy | 11 months | The cookie is set by the GDPR Cookie Consent plugin and is used to store whether or not user has consented to the use of cookies. It does not store any personal data. |
[hubspot type=form portal=2383378 id=6b773102-de9a-4e8c-86ad-af3f7fea5f47]