Pandas Dataframe Unique

Pandas Dataframe Unique



ไลบรารี Python ที่ได้รับความนิยมมากที่สุดซึ่งใช้ในวิทยาศาสตร์ข้อมูลเรียกว่า Pandas มีเครื่องมือวิเคราะห์ข้อมูลประสิทธิภาพสูง เป็นมิตรกับผู้ใช้ และโปรแกรมเมอร์ Python เมื่อคุณเข้าใจฟังก์ชันพื้นฐานและวิธีใช้งานแล้ว Pandas เป็นเครื่องมือที่มีศักยภาพในการแก้ไขข้อมูล ใน “แพนด้า” วิธีการมาตรฐานสำหรับการจัดเก็บข้อมูลในรูปแบบตารางคือ DataFrames เราสามารถใช้วิธี 'pandas' เพื่อรับค่าที่ไม่ซ้ำกันในคอลัมน์ของ 'pandas' DataFrame เมื่อเราต้องการรับค่าที่ไม่ซ้ำกันในคอลัมน์ของ DataFrame และไม่ต้องการให้ค่าซ้ำกันในคอลัมน์ของ DataFrame ของ “pandas” เราสามารถใช้วิธีที่ “pandas” จัดเตรียมไว้สำหรับการทำเช่นนี้ มาดูวิธีการดังกล่าวในคู่มือนี้ พร้อมกับตัวอย่างและผลลัพธ์บางส่วนเพื่อรับค่าที่ไม่ซ้ำกันในคอลัมน์ 'pandas' ของ DataFrame

วิธีการรับค่าที่ไม่ซ้ำในคอลัมน์ของ DataFrame “pandas”

เราสามารถใช้สองวิธีในการรับค่าที่ไม่ซ้ำกันในคอลัมน์ของ DataFrame ของ “pandas” เราลบค่าที่ซ้ำกันและรับเฉพาะค่าที่ไม่ซ้ำในคอลัมน์ของ DataFrames วิธีการที่ “แพนด้า” จัดเตรียมไว้สำหรับการทำงานนี้คือ:







  • โดยใช้เมธอด unique()
  • โดยใช้เมธอด drop_dupliactes()

ตอนนี้ เราจะใช้ทั้งสองวิธีในโค้ด 'pandas' เพื่อรับค่าที่ไม่ซ้ำกันในคอลัมน์ของ DataFrame 'pandas'



ตัวอย่าง # 01

แอป “Spyder” ถูกใช้ที่นี่เพื่อสร้างรหัส “แพนด้า” เหล่านี้เพื่อใช้วิธีการเหล่านั้น ซึ่งช่วยให้เราได้รับค่าที่ไม่ซ้ำกันในคอลัมน์ของ DataFrame “แพนด้า” เราต้องนำเข้าโมดูล 'pandas' ซึ่งจำเป็นสำหรับโค้ด 'pandas' ก่อนสร้าง DataFrame โดยใช้คำว่า 'นำเข้า' และวาง 'แพนด้าเป็น pd' เรานำเข้าโมดูลเหล่านี้



ด้วยความช่วยเหลือของ 'pd' เราจึงสามารถรับฟังก์ชันหรือวิธีการของ 'pandas' ได้อย่างรวดเร็ว จากนั้นเราใส่ 'Subject_data' ที่เราเพิ่ม 'ชื่อ' และใน 'ชื่อ' เรากำลังเพิ่มข้อมูลของชื่อ ได้แก่ 'Roman, William, Peter, Smith, John, Milli, Thomas และ James' จากนั้นเราเพิ่มข้อมูลวิชาใน “Subj” ซึ่งก็คือ “คณิตศาสตร์ เศรษฐศาสตร์ วิทยาศาสตร์ คณิตศาสตร์ สถิติ สถิติ สถิติ และคอมพิวเตอร์” จากนั้น เราแปลง “Subject_data” นี้เป็น “Subject_df” DataFrame โดยใช้เมธอด “pd.DataFrame()” เราใส่ “Subject_df” ในวิธี “print()” เพื่อให้แสดงบนเทอร์มินัล





ตอนนี้ เราต้องการรับค่าที่ไม่ซ้ำกันในคอลัมน์ 'Subj' ของ DataFrame 'pandas' เพื่อจุดประสงค์นี้ เราใช้เมธอด “unique()” ที่นี่ และเราเพิ่มชื่อคอลัมน์และชื่อของ DataFrame ดังที่แสดงด้านล่าง เราเพิ่มวิธีนี้ใน “print()” เพื่อให้ผลลัพธ์แสดงบนเทอร์มินัลด้วย



ตอนนี้ เรากำลังกด 'Shift+Enter' เพื่อรับผลลัพธ์ของโค้ดนี้และแสดงผลบนเทอร์มินัลและแสดงไว้ที่นี่ด้วย ซึ่งมี DataFrame พร้อมค่าทั้งหมด นี่คือ DataFrame ดั้งเดิมที่เราเพิ่มในโค้ด และด้านล่างจะแสดงค่าเฉพาะของคอลัมน์ 'Subj' มันลดค่าที่ซ้ำกันและแสดงค่าที่ไม่ซ้ำกันของคอลัมน์ 'Subj' ของ DataFrame

ตัวอย่าง # 02

เราสร้าง “Sample_list” ซึ่งมีข้อมูลบางส่วน เราแทรก 'Layla, 21, 28, 31, 14 และ 39' ซึ่งจะปรากฏเป็นคอลัมน์แรกเมื่อเราแปลงรายการนี้เป็น DataFrame จากนั้น เราเพิ่ม “Lusy, 31, 25, 34, 26 และ 21” เป็นแถวที่สองของ DataFrame หลังจากนี้ เรามี “Peter, 38, 20, 20, 35 และ 24” และ “Layla 38, 23, 39 24, 23” ซึ่งจะเป็นแถวที่สามและสี่ของ DataFrame นอกจากนี้เรายังแทรกข้อมูลอีกสามรายการ ได้แก่ “Stella, 21, 24, 24, 28, 31”, “Layla, 33, 32, 26, 30, 25” และ “Peter, 21, 21, 31, 21, 29” .

ตอนนี้ เรากำลังแปลง 'Sample_list' เป็น 'DF_Sample' ซึ่งเป็นชื่อของ DataFrame ที่นี่โดยใส่ฟังก์ชัน 'pd.DataFrame()' นอกจากนี้เรายังตั้งชื่อคอลัมน์ของ DataFrame นี้และชื่อเหล่านี้คือ “Name, Ass_1, Ass_2, Ass_3, Ass_4 และ Ass_5” จากนั้น เราใช้ “print()” ซึ่งช่วยในการแสดง DataFrame “DF_Sample” ตอนนี้ เรากำลังใช้วิธีอื่นในตัวอย่างนี้เพื่อรับค่าที่ไม่ซ้ำในคอลัมน์ของ DataFrame เมธอดนี้เป็นเมธอด “drop_duplicates()” ของ “pandas”

ในเมธอด “drop_duplicates()” เราตั้งชื่อคอลัมน์ที่เราต้องการรับค่าที่ไม่ซ้ำกันในคอลัมน์ของ DataFrame เราได้รับค่าที่ไม่ซ้ำกันของคอลัมน์ 'ชื่อ' โดยปล่อยค่าที่ซ้ำกันในคอลัมน์นี้ด้วยความช่วยเหลือของเมธอด 'drop_duplicates()' และแสดงค่าที่ไม่ซ้ำเหล่านี้โดยใช้ฟังก์ชัน 'print()' ที่นี่

ชื่อที่ซ้ำกันจะถูกละทิ้งและค่าที่ไม่ซ้ำกันจะแสดงหลังจากใช้เมธอด “drop_duplicates()” โปรดทราบว่าชื่อ 'Layla' ปรากฏในสามเซลล์ของคอลัมน์ 'ชื่อ' แต่เมื่อใช้วิธี “drop_duplicates()” กับคอลัมน์นี้ ค่าที่ซ้ำกันทั้งหมดจะหายไปและชื่อ “Layla” ปรากฏบนหน้าจอ หลังจากทิ้งค่าที่ซ้ำกัน DataFrame ใหม่จะปรากฏขึ้นซึ่งมีค่าที่ไม่ซ้ำกันในคอลัมน์ 'ชื่อ' นี้ ด้วยวิธีนี้ เราสามารถลบค่าที่ซ้ำกันและรับค่าที่ไม่ซ้ำในคอลัมน์ของ DataFrame โดยใช้เมธอด “drop_duplicates()”

ตัวอย่าง #03

มีการใช้ DataFrame เดียวกันอีกครั้ง และตอนนี้เรากำลังใช้เมธอด “unique()” ที่นี่ ด้วยเมธอด “unique()” เราจะใส่ชื่อของคอลัมน์และชื่อของ DataFrame ที่เราต้องการใช้เมธอด “unique()” เพื่อรับค่าที่ไม่ซ้ำ สิ่งนี้จะแสดงเฉพาะค่าเฉพาะของคอลัมน์นั้นและจะไม่แสดงค่าเหล่านี้ในรูปแบบของ DataFrame

ในที่นี้ DataFrame มีค่าเจ็ดค่าในคอลัมน์ 'ชื่อ' แต่เมื่อเราใช้เมธอด 'unique()' กับคอลัมน์นี้ มีเพียงสี่ค่าเท่านั้นที่ปรากฏขึ้น และค่าเหล่านี้เป็นค่าเฉพาะของคอลัมน์นั้น ไม่แสดงค่าที่ซ้ำกัน

ตัวอย่าง # 04

DataFrame ที่เราสร้างในตัวอย่างนี้คือ “F_G_df” เราแทรก “My_fruits” และ “my_Vegs” ใน DataFrame นี้ คอลัมน์ 'My_fruits' ประกอบด้วย 'Apple, Orange, Apple, Pear, Lychee, Apple, Apple, Pear และ Apple' ต่อไป เรามี “My_Vegs” ซึ่งมีชื่อผักได้แก่ “Chilli, Bringle, Carrot, Potato, Potato, Carrot, Onion, Garlic, and Ginger” DataFrame นี้มีเพียงสองคอลัมน์

ตอนนี้ เราได้รับค่าที่ไม่ซ้ำในทั้งสองคอลัมน์ โดยใช้เมธอด “unique()” เราพูดถึงชื่อ DataFrame จากนั้นใส่ชื่อคอลัมน์แรกของคอลัมน์ หลังจากนี้ เราใช้เมธอด append() ในส่วนต่อท้ายนี้ เราจะใส่ชื่อของ DataFrame และชื่อคอลัมน์ที่สองอีกครั้ง และวางเมธอด “unique()” สิ่งนี้จะได้รับค่าที่ไม่ซ้ำของทั้งสองคอลัมน์ จากนั้นผนวกค่าที่ไม่ซ้ำของทั้งสองคอลัมน์และปรากฏบนหน้าจอ

DataFrame แสดงผลก่อนโดยมีค่าทั้งหมด หลังจากนี้ จะใช้วิธี “unique()” และแสดงค่าที่ไม่ซ้ำของทั้งสองคอลัมน์ด้านล่าง ในโค้ดนี้ เราได้รับค่าที่ไม่ซ้ำกันในหลายคอลัมน์ของ DataFrame โดยใช้เมธอด “unique()”

บทสรุป

คำอธิบายแบบเต็มเกี่ยวกับการรับค่าที่ไม่ซ้ำกันในคอลัมน์ของ DataFrame มีอยู่ในคู่มือนี้ เราได้พูดถึงเมธอด “unique()” และ “drop_duplicates()” ซึ่งช่วยให้เราได้รับค่าที่ไม่ซ้ำของคอลัมน์ DataFrame เราได้สำรวจวิธีการใช้วิธีการเหล่านี้ในโค้ด 'pandas' โดยใช้วิธีการเหล่านี้ในโค้ดของเรา เราได้แสดงตัวอย่างต่างๆ ในคู่มือนี้ และได้แสดงวิธีรับค่าที่ไม่ซ้ำกันของคอลัมน์หนึ่งโดยใช้เมธอด “unique()” และเมธอด “drop_duplicates()” เราได้สำรวจวิธีรับค่าที่ไม่ซ้ำในหลายคอลัมน์โดยใช้เมธอด “unique()” ในคู่มือนี้