จะสร้างโปรแกรมรวบรวมข้อมูลเพื่อดึงข้อมูลจาก S3 Bucket ได้อย่างไร

Ca Srang Porkaerm Rwbrwm Khxmul Pheux Dung Khxmul Cak S3 Bucket Di Xyangri



AWS Glue ใช้เพื่อค้นหาข้อมูล ผสานรวมข้อมูล รวบรวมข้อมูล และสร้างแคตตาล็อกข้อมูลบนคลาวด์ ผู้ใช้สามารถสร้างโปรแกรมรวบรวมข้อมูลจาก AWS Glue ที่จะรวบรวมข้อมูลจากแหล่งที่มาที่กำหนดแล้วจัดเก็บไว้ในแคตตาล็อกข้อมูลเพื่อรับข้อมูล ผู้ใช้เพียงเรียกใช้โปรแกรมรวบรวมข้อมูลและโปรแกรมรวบรวมข้อมูลจะดำเนินการทุกอย่างภายในเวลาไม่นาน

คู่มือนี้จะอธิบายวิธีสร้างโปรแกรมรวบรวมข้อมูลเพื่อดึงข้อมูลจากบัคเก็ต S3

จะสร้างโปรแกรมรวบรวมข้อมูลเพื่อดึงข้อมูลจาก S3 Bucket ได้อย่างไร

หากต้องการสร้างโปรแกรมรวบรวมข้อมูลใน AWS โปรดไปที่ “ กาว AWS ” บริการจากแดชบอร์ดของ Amazon:









คลิกที่ ' ฐานข้อมูล ปุ่ม ” จากส่วน Data Catalog เพื่อสร้างฐานข้อมูล:







คลิกที่ ' เพิ่มฐานข้อมูล ปุ่ม ” เพื่อเริ่มการกำหนดค่า:



ป้อนชื่อฐานข้อมูลและปล่อยให้ทุกอย่างเป็นตัวเลือกก่อนที่จะคลิกที่ ' สร้างฐานข้อมูล ' ปุ่ม:

สร้างฐานข้อมูลสำเร็จแล้ว:

หลังจากนั้นเพียงไปที่ “ โปรแกรมรวบรวมข้อมูล ” โดยคลิกจากแผงด้านซ้าย:

คลิกที่ ' สร้างโปรแกรมรวบรวมข้อมูล ' ปุ่ม:

พิมพ์ชื่อโปรแกรมรวบรวมข้อมูลและคลิกที่ ' ต่อไป ' ปุ่ม:

คลิกที่ ' เพิ่มแหล่งข้อมูล ปุ่ม ” เพื่อเลือกแหล่งที่มาของข้อมูล:

หากต้องการตรวจสอบเส้นทางที่จัดเก็บข้อมูล ให้ไปที่บริการ S3:

ไปที่บัคเก็ต S3 ที่อัปโหลดข้อมูล ผู้ใช้สามารถ สร้าง ถังและ ที่อัพโหลด ข้อมูลจากแดชบอร์ด AWS S3:

คลิกที่ ' เรียกดู S3 ปุ่ม ” เพื่อเลือกเส้นทางของข้อมูล:

เลือกโฟลเดอร์ที่มีข้อมูล จากนั้นคลิกที่ “ เลือก ' ปุ่ม:

เส้นทาง S3 ถูกเลือกแล้ว ตอนนี้คลิกที่ “ เพิ่มแหล่งข้อมูล S3 ' ปุ่ม:

เมื่อเพิ่มแหล่งข้อมูลแล้ว เพียงคลิกที่ “ ต่อไป ' ปุ่ม:

เพิ่มบทบาท IAM จากนั้นคลิกที่ ' ต่อไป ' ปุ่ม:

ป้อนฐานข้อมูลเป้าหมายที่สร้างไว้ก่อนหน้านี้ จากนั้นพิมพ์ชื่อสำหรับตาราง:

เลือกกำหนดการตามความต้องการสำหรับโปรแกรมรวบรวมข้อมูลและคลิกที่ ' ต่อไป ' ปุ่ม:

ตรวจสอบโปรแกรมรวบรวมข้อมูลและคลิกที่ ' สร้างโปรแกรมรวบรวมข้อมูล ' ปุ่ม:

สร้างโปรแกรมรวบรวมข้อมูลสำเร็จแล้ว คลิกที่ “ วิ่ง ” หลังจากเลือกแล้ว:

จะใช้เวลาสักครู่ในการเรียกใช้โปรแกรมรวบรวมข้อมูลและจะดึงข้อมูลและสร้างตารางเพื่อจัดเก็บข้อมูล:

มุ่งหน้าสู่ “ ตาราง ” หน้าจากแดชบอร์ดกาว:

เลือกตารางโดยคลิกที่ชื่อ:

มีการแสดงรายละเอียดเรื่องราวที่มีข้อมูลเมตาของข้อมูลที่ดึงมา:

เลื่อนหน้าลงมาและเลือกส่วนเพื่อดูตารางที่มีข้อมูล:

นั่นคือทั้งหมดที่เกี่ยวกับการสร้างโปรแกรมรวบรวมข้อมูลเพื่อดึงข้อมูลจากบัคเก็ต S3

บทสรุป

หากต้องการสร้างโปรแกรมรวบรวมข้อมูลเพื่อดึงข้อมูลจากบัคเก็ต S3 ให้สร้างฐานข้อมูลบน AWS Glue ซึ่งจะเก็บข้อมูลที่รวบรวมข้อมูลไว้ กำหนดค่าโปรแกรมรวบรวมข้อมูลจากแดชบอร์ด Glue โดยระบุแหล่งที่มาของข้อมูล (บัคเก็ต S3) และฐานข้อมูลเป้าหมาย เรียกใช้โปรแกรมรวบรวมข้อมูลและดึงข้อมูลจากบัคเก็ต S3 ไปยังตารางฐานข้อมูลตามที่คู่มือนี้ได้อธิบายไว้อย่างละเอียด