Pandas อ่านไฟล์ข้อความ

Pandas Xan Fil Khxkhwam



“ใน “แพนด้า” เราสามารถอ่านไฟล์ข้อความได้อย่างง่ายดายโดยใช้วิธี “แพนด้า” “แพนด้า” เปิดโอกาสให้เราอ่านไฟล์ข้อความ “แพนด้า” มีวิธีการในตัวที่แตกต่างกันสำหรับการอ่านไฟล์ข้อความ เราจะพูดถึงวิธีการทั้งหมดในบทช่วยสอนนี้พร้อมกับพารามิเตอร์ทั้งหมดที่นี่ และจะอธิบายโดยละเอียด นอกจากนี้ เราจะอ่านไฟล์ข้อความใน “pandas” โดยใช้วิธีการของ “pandas” ในโค้ดของเราที่นี่

วิธีการอ่านไฟล์ข้อความใน “หมีแพนด้า”

ใน “แพนด้า” เรามีสามวิธีที่ช่วยในการอ่านไฟล์ข้อความ เราได้ทำตัวอย่างบางส่วนที่นี่ซึ่งเราอ่านไฟล์ข้อความ วิธีการที่ “หมีแพนด้า” มีให้มีการอธิบายไว้ด้านล่าง:







    • โดยใช้เมธอด pd.read_csv()
    • โดยใช้เมธอด pd.read_table()
    • โดยใช้เมธอด pd.read_fwf()

ตอนนี้ เรากำลังอธิบายไวยากรณ์ของวิธีการเหล่านี้ทั้งหมด และยังกล่าวถึงพารามิเตอร์ของวิธีการทั้งหมดโดยละเอียดในบทช่วยสอนนี้



ไวยากรณ์ของ read_csv()



pd.read_csv ( 'ชื่อไฟล์.txt' ก.ย =' ', หัวข้อ =ไม่มี ชื่อ = [ “Col_name1”, “Col_name2, “Col_name2”, ………….. ] )


ในวิธีนี้ ก่อนอื่นเราเพิ่มชื่อไฟล์ข้อความที่มีข้อมูลที่เราต้องการอ่าน และเป็นพารามิเตอร์แรกของวิธีนี้ จากนั้น เราวาง 'sep' ซึ่งเป็นตัวคั่นในวิธีนี้ และเราใส่ช่องว่างที่นี่เป็นอักขระ เพื่อให้พิจารณาช่องว่างเป็นตัวคั่น หลังจากนี้ เรามีพารามิเตอร์ส่วนหัว และใช้ค่า 'ไม่มี' ของพารามิเตอร์นี้ ดังนั้นจะสร้างส่วนหัวเริ่มต้น และหากเราไม่เพิ่มพารามิเตอร์นี้ ระบบจะพิจารณาบรรทัดแรกของไฟล์ข้อความ เป็นส่วนหัว ในพารามิเตอร์ 'ชื่อ' เราสามารถเพิ่มชื่อคอลัมน์ที่เราต้องเพิ่มเป็นส่วนหัวได้





ไวยากรณ์ของ read_table()

pd.read_table ( 'ชื่อไฟล์.txt' , ตัวคั่น = ' ' )


ในวิธีนี้ เราใส่ชื่อไฟล์ของไฟล์ข้อความเป็นพารามิเตอร์แรก ในตัวคั่น เมื่อเราวาง ' ' มันจะใช้อักขระเว้นวรรคเป็นตัวคั่น



ไวยากรณ์ของ read_fwf()

pd.read_fwf ( 'ชื่อไฟล์.txt' )


เมธอดนี้ใช้พารามิเตอร์เพียงตัวเดียว ซึ่งเป็นชื่อของไฟล์ข้อความ

ตอนนี้ เราจะใช้วิธีเหล่านี้ในการอ่านไฟล์ข้อความในโค้ด 'pandas' และแสดงข้อมูลของไฟล์ข้อความบนเทอร์มินัล

ตัวอย่าง # 01

แอพ “Spyder” อยู่ที่นี่ซึ่งเราได้ทำรหัสเหล่านี้ทั้งหมดซึ่งนำเสนอในบทช่วยสอนนี้ ไฟล์ข้อความที่มีข้อมูลที่เราต้องการอ่านแสดงอยู่ด้านล่าง เราจะใช้เมธอด “read_csv()” เพื่ออ่านไฟล์ข้อความนี้ใน “pandas”


ก่อนอื่นเรานำเข้าไลบรารี 'pandas' เพราะเราต้องการใช้เมธอด 'read_csv()' และเป็นวิธีการของ 'pandas' เราเข้าถึงวิธีนี้ก็ต่อเมื่อเรานำเข้าไลบรารีของ “แพนด้า” เท่านั้น ในที่นี้เราพูดถึง “pandas as pd” ดังนั้น “pd” นี้จึงถูกใส่ชื่อวิธีการใช้งาน หลังจากนี้ เราสร้างตัวแปร “df” ที่นี่ ซึ่งใช้สำหรับจัดเก็บข้อมูลของไฟล์ข้อความหลังจากอ่าน เราวางเมธอด “pd.read_csv()” ไว้ที่นี่ ซึ่งช่วยในการอ่านไฟล์ข้อความและแปลงข้อมูลไฟล์ข้อความเป็น DataFrame และจัดเก็บไว้ในตัวแปร “df”

เราได้ส่งชื่อไฟล์ซึ่งก็คือ 'myData.txt' ที่นี่ จากนั้นเราใช้ 'sep' และกำหนดอักขระว่างให้กับ 'sep' นี้ ดังนั้น อักขระว่างนี้จึงทำงานเป็นตัวคั่นในไฟล์ข้อความ จากนั้น เราใช้ “print()” ด้านล่าง ซึ่งใช้สำหรับพิมพ์ข้อมูลของไฟล์ข้อความ จะแสดงข้อมูลของไฟล์ข้อความในรูปแบบ DataFrame


สำหรับการดำเนินการของโค้ดนี้ เราต้องกด 'Shift+Enter' และผลลัพธ์จะแสดงผลบนเทอร์มินัล 'Spyder's' ผลลัพธ์ของโค้ดด้านบนจะแสดงในภาพหน้าจอที่กำหนด และคุณจะเห็นว่าข้อมูลของไฟล์ข้อความแสดงเป็น DataFrame และบรรทัดแรกของไฟล์ข้อความของเราจะแสดงที่นี่เป็นชื่อคอลัมน์ของ DataFrame นั้น นอกจากนี้ยังแยกข้อมูลที่อักขระเว้นวรรคอยู่ในไฟล์ข้อความ

ตัวอย่าง # 02

ไฟล์ข้อความที่เราจะอ่านในตัวอย่างนี้จะแสดงที่นี่ และเราจะใช้เมธอด “read_csv()” อีกครั้ง แต่มีพารามิเตอร์ต่างกัน


ใช้เมธอด “pandas” “pd.read_csv()” และเราส่งพารามิเตอร์สามตัวที่นี่ ขั้นแรก เราใส่ชื่อไฟล์ซึ่งก็คือ “Record.txt” พารามิเตอร์ที่สองคือพารามิเตอร์ 'sep' และกำหนดอักขระว่างให้ จากนั้นเรามีพารามิเตอร์ที่สามที่เราตั้งค่า 'ส่วนหัว' และปรับเป็น 'ไม่มี' ดังนั้นจะสร้างส่วนหัวเริ่มต้นของ DataFrame เมื่อเรารันโค้ดนี้ เราได้บันทึกทั้งหมดนี้ไว้ในตัวแปร 'My_Record' และเพิ่ม 'My_Record' ในฟังก์ชัน 'print()' สำหรับการพิมพ์


ข้อมูลทั้งหมดจะถูกบันทึกไว้ใน DataFrame และแยกข้อมูลที่มีอักขระเว้นวรรคในข้อมูลไฟล์ข้อความ นอกจากนี้ยังสร้างส่วนหัวเริ่มต้นของ DataFrame ที่นี่ เพราะเราปรับพารามิเตอร์ 'ส่วนหัว' เป็น 'ไม่มี'

ตัวอย่าง #03

ไฟล์ข้อความของตัวอย่างนี้จะแสดงขึ้น และเราจะใช้เมธอด “read_csv()” พร้อมพารามิเตอร์ที่แก้ไขอีกครั้ง


ในโค้ดนี้ พารามิเตอร์สี่ตัวจะถูกส่งไปยังเมธอด “pandas” “pd.read_csv()” ชื่อไฟล์ข้อความเป็นพารามิเตอร์แรก พารามิเตอร์ 'sep' ถูกกำหนดให้เป็นอักขระว่างในพารามิเตอร์ที่สอง พารามิเตอร์ 'ส่วนหัว' ถูกตั้งค่าเป็น 'ไม่มี' ในอาร์กิวเมนต์ที่สาม และเนื่องจากพารามิเตอร์ที่สี่ เราได้ตั้งค่า 'ชื่อ' ซึ่งจะปรากฏเป็นชื่อคอลัมน์ของ DataFrame หลังจากอ่านไฟล์ข้อความ และชื่อคอลัมน์เหล่านี้คือ “COL_1, COL_2, COL_3, COL_4 และ COL_5” ข้อมูลทั้งหมดนี้ได้รับการบันทึกไว้ในตัวแปร 'My_Record' และ 'My_Record' ถูกเพิ่มลงในวิธี 'print()' ด้วย เพื่อให้พิมพ์บนเทอร์มินัล


ข้อมูลทั้งหมดของไฟล์ข้อความแสดงที่นี่เป็น DataFrame และยังแยกข้อมูลที่เพิ่มช่องว่างในไฟล์ข้อความ นอกจากนี้ยังเพิ่มชื่อคอลัมน์ตามที่เราได้เพิ่มไว้ข้างต้นในโค้ด

ตัวอย่าง # 04

นี่คือไฟล์ข้อความที่เราจะอ่านในตัวอย่างนี้โดยใช้วิธีการอื่น วิธี “pd.read_table()”


เพิ่มเมธอด “pd.read_table()” เพื่ออ่านไฟล์ข้อความ และเราเพิ่ม “ABC.txt” ซึ่งเป็นชื่อไฟล์ข้อความ วิธีนี้ช่วยในการอ่านไฟล์ข้อความ และเราได้ปรับพารามิเตอร์ 'ตัวคั่น' เป็นอักขระเว้นวรรค ดังนั้นจึงทำงานเหมือนกับตัวคั่นที่เราได้อธิบายไว้ข้างต้น จากนั้นข้อมูลไฟล์ของข้อความทั้งหมดจะถูกบันทึกในตัวแปร 'My_Data' และพิมพ์ที่นี่ด้วย


บรรทัดเริ่มต้นของไฟล์ข้อความของเราจะแสดงที่นี่เป็นชื่อคอลัมน์ของ DataFrame และข้อมูลของไฟล์ข้อความจะถูกพิมพ์เป็น DataFrame นอกจากนี้ยังแยกข้อมูลของไฟล์ข้อความที่มีอักขระช่องว่างอยู่ด้วย

ตัวอย่าง # 05

ตอนนี้ไฟล์ข้อความมีข้อมูลซึ่งแสดงอยู่ด้านล่าง เราจะใช้ “read_fwf()” ในครั้งนี้และจะแสดงวิธีการแสดงข้อมูลหลังจากอ่านไฟล์ข้อความ


อย่างที่เราทราบกันดีอยู่แล้วว่าเมธอด “read_fwf()” นี้ใช้พารามิเตอร์เพียงตัวเดียว ซึ่งเป็นชื่อไฟล์ที่เราต้องการอ่าน เราเพิ่ม “textfile.txt” ที่นี่ ซึ่งเป็นชื่อของไฟล์ข้อความของเรา และกำหนดเมธอดแพนด้านี้ให้กับตัวแปร “File_Data” ซึ่งจะเก็บข้อมูลของไฟล์ข้อความนี้ จากนั้นเราใส่ 'print(File_Data)' เพื่อให้พิมพ์ข้อมูลนี้ด้วย


ที่นี่ ข้อมูลทั้งหมดของไฟล์ข้อความจะแสดงขึ้น ไม่ได้แยกข้อมูลที่มีอักขระเว้นวรรคเนื่องจากไม่มีพารามิเตอร์เช่น 'Sep' หรือ 'delimiter' ในฟังก์ชันนี้

บทสรุป

บทช่วยสอนนี้จะอธิบายวิธีอ่านไฟล์ข้อความใน “pandas” และวิธีใดที่ใช้ในการอ่านไฟล์ข้อความใน “pandas” เราได้กล่าวถึงวิธีการทั้งหมดที่ช่วยเราในการอ่านไฟล์ข้อความใน “หมีแพนด้า” เราได้สำรวจวิธีการต่างๆ ของ “แพนด้า” สามวิธีสำหรับการอ่านไฟล์ข้อความของเราใน “แพนด้า” ในบทช่วยสอนนี้ เรายังได้อธิบายไวยากรณ์ของวิธีการทั้งหมดรวมถึงพารามิเตอร์ของวิธีการทั้งหมดโดยละเอียดที่นี่ และได้อ่านไฟล์ข้อความจำนวนมากโดยใช้วิธีการต่างๆ กับพารามิเตอร์ที่เป็นไปได้ทั้งหมดในบทช่วยสอนนี้