หมีแพนด้าเติมน่านด้วย0

Hmi Phaenda Teim Nan Dwy0



วิทยาศาสตร์ข้อมูลมักเกี่ยวข้องกับข้อมูลที่ขาดหายไป สามารถละทิ้งทั้งแถวหรือเพิ่มค่าลงในชุดค่าผสมของแถวและคอลัมน์ได้ การวางแถว/คอลัมน์จะเป็นเรื่องเหลวไหลเพราะจะลบเมตริกบางตัวสำหรับทุกแถว NaN ซึ่งย่อมาจาก “Not a Number” เป็นหนึ่งในวิธีทั่วไปในการแสดงค่าที่ขาดหายไปจากชุดข้อมูล เพื่อให้ได้ผลลัพธ์ที่ต้องการ การจัดการ NaN นั้นค่อนข้างสำคัญ มาดูวิธีการเปลี่ยนค่า NaN ในแถวหรือคอลัมน์ของ Pandas DataFrame เป็น 0

หมีแพนด้าเติมค่า NaN

หากคอลัมน์ใน data frame ของคุณมีค่า NaN หรือ None คุณสามารถใช้ฟังก์ชัน “fillna()” หรือ “replace()” เพื่อเติมค่าเหล่านั้นด้วยศูนย์ (0)

เติม()







ค่า NA/NaN จะถูกเติมด้วยวิธีที่ให้ไว้โดยใช้ฟังก์ชัน “fillna()” สามารถใช้โดยพิจารณาไวยากรณ์ต่อไปนี้:



หากคุณต้องการเติมค่า NaN สำหรับคอลัมน์เดียว ไวยากรณ์จะเป็นดังนี้:




เมื่อคุณต้องกรอกค่า NaN สำหรับ DataFrame ที่สมบูรณ์ ไวยากรณ์จะเป็นดังนี้:






แทนที่()

ในการแทนที่คอลัมน์เดียวของค่า NaN ไวยากรณ์ที่ให้ไว้จะเป็นดังนี้:




ในขณะที่เพื่อแทนที่ค่า NaN ของ DataFrame ทั้งหมด เราต้องใช้ไวยากรณ์ที่กล่าวถึงต่อไปนี้:


ในบทความนี้ เราจะมาสำรวจและเรียนรู้การใช้งานจริงของทั้งสองวิธีเพื่อเติมค่า NaN ใน Pandas DataFrame ของเรา

ตัวอย่างที่ 1: กรอกค่า NaN โดยใช้ Pandas “Fillna()” Method

ภาพประกอบนี้สาธิตการใช้ฟังก์ชัน Pandas “DataFrame.fillna()” เพื่อเติมค่า NaN ใน DataFrame ที่กำหนดด้วย 0 คุณสามารถเติมค่าที่ขาดหายไปในคอลัมน์เดียวหรือกรอกสำหรับ DataFrame ทั้งหมด ที่นี่เราจะเห็นทั้งสองเทคนิคนี้

ในการนำกลยุทธ์เหล่านี้ไปใช้จริง เราจำเป็นต้องมีแพลตฟอร์มที่เหมาะสมสำหรับการดำเนินการของโปรแกรม ดังนั้นเราจึงตัดสินใจใช้เครื่องมือ “Spyder” เราเริ่มโค้ด Python ของเราโดยนำเข้าชุดเครื่องมือ 'pandas' ลงในโปรแกรม เนื่องจากเราจำเป็นต้องใช้ฟีเจอร์ Pandas เพื่อสร้าง DataFrame รวมทั้งเติมค่าที่ขาดหายไปใน DataFrame นั้น “pd” ถูกใช้เป็นนามแฝงของ “pandas” ตลอดทั้งโปรแกรม

ตอนนี้ เรามีการเข้าถึงฟีเจอร์ของ Pandas แล้ว ก่อนอื่นเราใช้ฟังก์ชัน “pd.DataFrame()” เพื่อสร้าง DataFrame ของเรา เราเรียกใช้วิธีนี้และเริ่มต้นด้วยสามคอลัมน์ ชื่อของคอลัมน์เหล่านี้คือ 'M1', 'M2' และ 'M3' ค่าในคอลัมน์ 'M1' คือ '1', 'None', '5', '9' และ '3' รายการใน “M2” ได้แก่ “ไม่มี”, “3”, “8”, “4” และ “6” ในขณะที่ 'M3' เก็บข้อมูลเป็น '1', '2', '3', '5' และ 'None' เราต้องการวัตถุ DataFrame ซึ่งเราสามารถจัดเก็บ DataFrame นี้ได้เมื่อมีการเรียกเมธอด “pd.DataFrame()” เราได้สร้างวัตถุ DataFrame ที่ 'หายไป' และกำหนดโดยผลลัพธ์ที่เราได้รับจากฟังก์ชัน 'pd.DataFrame()' จากนั้น เราใช้เมธอด “print()” ของ Python เพื่อแสดง DataFrame บนคอนโซล Python


เมื่อเราเรียกใช้โค้ดส่วนนี้ สามารถดู DataFrame ที่มีสามคอลัมน์บนเทอร์มินัลได้ ที่นี่ เราสามารถสังเกตได้ว่าทั้งสามคอลัมน์มีค่า Null อยู่ในนั้น


เราได้สร้าง DataFrame ด้วยค่า Null เพื่อใช้ฟังก์ชัน “fillna()” ของ Pandas เพื่อเติมค่าที่ขาดหายไปด้วย 0 มาเรียนรู้ว่าเราจะทำอย่างไร

หลังจากแสดง DataFrame เราเรียกใช้ฟังก์ชัน Pandas “fillna()” ที่นี่ เราจะเรียนรู้การเติมค่าที่ขาดหายไปในคอลัมน์เดียว ไวยากรณ์สำหรับสิ่งนี้ถูกกล่าวถึงแล้วในตอนเริ่มต้นของบทช่วยสอน เราระบุชื่อของ DataFrame และระบุชื่อคอลัมน์เฉพาะด้วยฟังก์ชัน “.fillna()” ระหว่างวงเล็บของเมธอดนี้ เราได้ระบุค่าที่จะใส่ในตำแหน่งว่าง ชื่อ DataFrame คือ 'หายไป' และคอลัมน์ที่เราเลือกที่นี่คือ 'M2' ค่าที่ระบุระหว่างวงเล็บปีกกาของ 'fillna()' คือ '0' สุดท้าย เราเรียกฟังก์ชัน “print()” เพื่อดู DataFrame ที่อัปเดต


ที่นี่ คุณจะเห็นว่าคอลัมน์ 'M2' ของ DataFrame ไม่ได้เก็บค่าที่ขาดหายไปในขณะนี้ เนื่องจากค่า NaN ถูกเติมด้วย 0


ในการเติมค่า NaN สำหรับ DataFrame ทั้งหมดด้วยวิธีเดียวกัน เราเรียก 'fillna()' นี้ค่อนข้างง่าย เราระบุชื่อ DataFrame ด้วยฟังก์ชัน 'fillna()' และกำหนดค่าฟังก์ชัน '0' ระหว่างวงเล็บ ในที่สุด ฟังก์ชัน “print()” แสดงให้เราเห็น DataFrame ที่เติมเต็ม


สิ่งนี้ทำให้เราได้รับ DataFrame ที่ไม่มีค่า NaN เนื่องจากค่าทั้งหมดถูกเติมด้วย 0 ทันที

ตัวอย่างที่ 2: กรอกค่า NaN โดยใช้ Pandas “Replace()” Method

ส่วนนี้ของบทความแสดงวิธีอื่นในการเติมค่า NaN ใน DataFrame เราจะใช้ฟังก์ชัน 'replace()' ของ Pandas เพื่อเติมค่าในคอลัมน์เดียวและใน DataFrame ที่สมบูรณ์

เราเริ่มเขียนโค้ดในเครื่องมือ 'Spyder' ขั้นแรก เรานำเข้าไลบรารีที่จำเป็น ที่นี่ เราโหลดไลบรารี Pandas เพื่อเปิดใช้งานโปรแกรม Python เพื่อใช้เมธอด Pandas ไลบรารีที่สองที่เราโหลดคือ NumPy และใช้นามแฝงว่า 'np' NumPy จัดการกับข้อมูลที่ขาดหายไปด้วยวิธีการ “replace()”

จากนั้น เราสร้าง DataFrame ที่มีสามคอลัมน์ ได้แก่ 'สกรู' 'ตะปู' และ 'เจาะ' ค่าในแต่ละคอลัมน์จะได้รับตามลำดับ คอลัมน์ 'สกรู' มีค่า '112', '234', 'ไม่มี' และ '650' คอลัมน์ 'เล็บ' มี '123', '145', 'ไม่มี' และ '711' สุดท้าย คอลัมน์ 'เจาะ' มีค่า '312', 'ไม่มี', '500' และ 'ไม่มี' DataFrame ถูกเก็บไว้ในออบเจ็กต์ DataFrame 'เครื่องมือ' และแสดงโดยใช้เมธอด 'print()'


DataFrame ที่มีค่า NaN สี่ค่าในบันทึกสามารถเห็นได้ในรูปเอาต์พุตต่อไปนี้:


ตอนนี้ เราใช้เมธอด “replace()” ของ Pandas เพื่อเติมค่า null ในคอลัมน์เดียวของ DataFrame สำหรับงาน เราเรียกใช้ฟังก์ชัน 'replace()' เราได้ระบุชื่อ DataFrame “เครื่องมือ” และคอลัมน์ “สกรู” ด้วยวิธีการ “.replace()” ระหว่างวงเล็บปีกกา เราตั้งค่า '0' สำหรับรายการ 'np.nan' ใน DataFrame ใช้วิธีการ “print()” เพื่อแสดงผลลัพธ์


DataFrame ที่เป็นผลลัพธ์แสดงให้เราเห็นคอลัมน์แรกที่มีรายการ NaN ถูกแทนที่ด้วย 0 ในคอลัมน์ 'สกรู'


ตอนนี้ เราจะเรียนรู้การเติมค่าใน DataFrame ทั้งหมด เราเรียกเมธอด “replace()” ด้วยชื่อของ DataFrame และระบุค่าที่เราต้องการแทนที่ด้วยรายการ np.nan สุดท้าย เราพิมพ์ DataFrame ที่อัปเดตด้วยฟังก์ชัน “print()”


สิ่งนี้ทำให้เราได้ DataFrame ที่เป็นผลลัพธ์โดยไม่มีบันทึกที่ขาดหายไป

บทสรุป

การจัดการกับรายการที่ขาดหายไปใน DataFrame เป็นพื้นฐานและเป็นข้อกำหนดที่จำเป็นเพื่อลดความซับซ้อนและจัดการกับข้อมูลอย่างท้าทายในกระบวนการวิเคราะห์ข้อมูล Pandas มีทางเลือกสองสามทางในการจัดการกับปัญหานี้ เรานำเสนอกลยุทธ์ที่มีประโยชน์สองประการในคู่มือนี้ เรานำเทคนิคทั้งสองไปใช้จริงโดยใช้เครื่องมือ 'Spyder' เพื่อรันโค้ดตัวอย่างเพื่อให้เข้าใจได้ง่ายขึ้นและง่ายขึ้นสำหรับคุณ การได้รับความรู้เกี่ยวกับฟังก์ชันเหล่านี้จะช่วยเพิ่มพูนทักษะของ Pandas