รับจำนวนคอลัมน์ใน R DataFrame

Rab Canwn Khxlamn Ni R Dataframe



ใน R การรับจำนวนคอลัมน์เป็นการดำเนินการพื้นฐานที่จำเป็นในหลาย ๆ สถานการณ์เมื่อทำงานกับ DataFrames เมื่อทำการย่อย วิเคราะห์ จัดการ เผยแพร่ และแสดงข้อมูลเป็นภาพ จำนวนคอลัมน์เป็นข้อมูลสำคัญที่ต้องทราบ ดังนั้น R จึงมีแนวทางที่แตกต่างกันในการรับผลรวมของคอลัมน์ของ DataFrame ที่ระบุ ในบทความนี้ เราจะพูดถึงวิธีการบางอย่างที่ช่วยให้เราได้จำนวนคอลัมน์ของ DataFrame

ตัวอย่างที่ 1: การใช้ฟังก์ชัน Ncol()

ncol() เป็นฟังก์ชันที่ใช้บ่อยที่สุดในการรับผลรวมของคอลัมน์ของ DataFrames







df <- data.frame('y1' = ค(10, 12, 14, 19),

'y2' = ค(15, 22, 24, 29),
'y3' = ค(25, 32, 34, 39))


n <- ncol(df)

cat('----- จำนวนคอลัมน์ใน Data Frame :', n)

ในตัวอย่างนี้ อันดับแรก เราสร้าง DataFrame “df” ที่มีสามคอลัมน์ซึ่งมีป้ายกำกับว่า “y1”, “y2” และ “y3” โดยใช้ฟังก์ชัน data.frame() ใน R องค์ประกอบในแต่ละคอลัมน์ระบุโดยใช้ ฟังก์ชัน c() ซึ่งสร้างเวกเตอร์ขององค์ประกอบ จากนั้น เมื่อใช้ตัวแปร “n” ฟังก์ชัน ncol() จะใช้ในการกำหนดจำนวนคอลัมน์ทั้งหมดใน DataFrame “df” สุดท้าย ด้วยข้อความอธิบายและตัวแปร 'n' ฟังก์ชัน cat() ที่ให้มาจะพิมพ์ผลลัพธ์บนคอนโซล



ตามที่คาดไว้ เอาต์พุตที่ดึงมาบ่งชี้ว่า DataFrame ที่ระบุมีสามคอลัมน์:







ตัวอย่างที่ 2: นับจำนวนคอลัมน์ทั้งหมดสำหรับ DataFrame ที่ว่างเปล่า

ต่อไป เราใช้ฟังก์ชัน ncol() กับ DataFrame ที่ว่างเปล่าซึ่งรับค่าของคอลัมน์ทั้งหมดด้วย แต่ค่านั้นเป็นศูนย์

Empty_df <- data.frame ()

n <- ncol (empty_df)

cat('---คอลัมน์ใน Data Frame :', n)

ในตัวอย่างนี้ เราสร้าง DataFrame ว่าง “empty_df” โดยเรียกใช้ data.frame() โดยไม่ระบุคอลัมน์หรือแถวใดๆ ต่อไป เราใช้ฟังก์ชัน ncol() ซึ่งใช้ในการหาจำนวนคอลัมน์ใน DataFrame ฟังก์ชัน ncol() ถูกตั้งค่าด้วย DataFrame “empty_df” ที่นี่เพื่อรับคอลัมน์ทั้งหมด เนื่องจาก DataFrame “empty_df” ว่างเปล่า จึงไม่มีคอลัมน์ใดๆ ดังนั้น ผลลัพธ์ของ ncol(empty_df) คือ 0 ผลลัพธ์จะแสดงโดยฟังก์ชัน cat() ซึ่งใช้งานที่นี่



ผลลัพธ์แสดงค่า '0' ตามที่คาดไว้เนื่องจาก DataFrame ว่างเปล่า

ตัวอย่างที่ 3: การใช้ฟังก์ชัน Select_If() กับฟังก์ชัน Length()

หากเราต้องการดึงจำนวนคอลัมน์ประเภทใดประเภทหนึ่ง เราควรใช้ฟังก์ชัน select_if() ร่วมกับฟังก์ชัน length() ของ R ฟังก์ชันเหล่านี้ใช้รวมกันเพื่อให้ได้จำนวนคอลัมน์ทั้งหมดของแต่ละประเภท . โค้ดสำหรับใช้ฟังก์ชันเหล่านี้มีการใช้งานดังต่อไปนี้:

ห้องสมุด (dplyr)

x1<-ตัวอักษร[1:10]

x2<-rpois(10,2)

x3<-rpois(10,5)

x4<-sample(c('ฤดูร้อน','ฤดูหนาว'),10,แทนที่=จริง)

df1<-data.frame(x1,x2,x3,x4)

df1

ความยาว (select_if (df1, is.numeric))

ในตัวอย่างนี้ ก่อนอื่นเราโหลดแพ็คเกจ dplyr เพื่อให้เราสามารถเข้าถึงฟังก์ชัน select_if() และฟังก์ชัน length() จากนั้น เราสร้างตัวแปรสี่ตัว – “x1”, “x2”, “x3” และ “x4” ตามลำดับ ที่นี่ “x1” ประกอบด้วยตัวอักษรภาษาอังกฤษตัวพิมพ์ใหญ่ 10 ตัวแรก ตัวแปร “x2” และ “x3” ถูกสร้างขึ้นโดยใช้ฟังก์ชัน rpois() เพื่อสร้างเวกเตอร์ 2 ตัวที่แยกจากกันของตัวเลขสุ่ม 10 ตัวที่มีพารามิเตอร์ 2 และ 5 ตามลำดับ ตัวแปร “x4” คือเวกเตอร์ตัวประกอบที่มี 10 องค์ประกอบที่สุ่มตัวอย่างจากเวกเตอร์ c (“ฤดูร้อน”, “ฤดูหนาว”)

จากนั้น เราพยายามสร้าง DataFrame “df1” โดยที่ตัวแปรทั้งหมดจะถูกส่งผ่านในฟังก์ชัน data.frame() สุดท้าย เราเรียกใช้ฟังก์ชัน length() เพื่อกำหนดความยาวของ DataFrame “df1” ที่สร้างขึ้นโดยใช้ฟังก์ชัน select_if() จากแพ็คเกจ dplyr ฟังก์ชัน select_if() จะเลือกคอลัมน์จาก DataFrame “df1” เป็นอาร์กิวเมนต์ และฟังก์ชัน is.numeric() จะเลือกเฉพาะคอลัมน์ที่มีค่าตัวเลขเท่านั้น จากนั้น ฟังก์ชัน length() จะรับผลรวมของคอลัมน์ที่เลือกโดย select_if() ซึ่งเป็นผลลัพธ์ของโค้ดทั้งหมด

ความยาวของคอลัมน์จะแสดงในผลลัพธ์ต่อไปนี้ซึ่งระบุคอลัมน์ทั้งหมดของ DataFrame:

ตัวอย่างที่ 4: การใช้ฟังก์ชัน Sapply()

ในทางกลับกัน หากเราต้องการนับเฉพาะค่าที่ขาดหายไปของคอลัมน์ เราก็มีฟังก์ชัน sapply() ฟังก์ชัน sapply() วนซ้ำแต่ละคอลัมน์ของ DataFrame เพื่อทำงานโดยเฉพาะ ฟังก์ชัน sapply() จะถูกส่งผ่านด้วย DataFrame เป็นอาร์กิวเมนต์ก่อน จากนั้นจะใช้การดำเนินการใน DataFrame นั้น การใช้ฟังก์ชัน sapply() เพื่อรับจำนวนค่า NA ในคอลัมน์ DataFrame มีดังต่อไปนี้:

new_df <- data.frame(c1 = c(10, 11, NA, 13, NA),

c2 = c('N', NA, 'A', 'M', 'E'),
c3 = ค(NA, 92, NA, NA, 95))

sapply(new_df, ฟังก์ชัน(x) ผลรวม(is.na(x)))

ในตัวอย่างนี้ เราสร้าง DataFrame “new_df” ที่มีสามคอลัมน์ – “c1”, “c2” และ “c3” คอลัมน์แรก 'c1' และ 'c3' มีค่าตัวเลข รวมทั้งค่าที่ขาดหายไปซึ่งแสดงโดย NA คอลัมน์ที่สอง 'c2' มีอักขระรวมถึงค่าที่ขาดหายไปซึ่งแสดงด้วย NA จากนั้น เราใช้ฟังก์ชัน sapply() กับ DataFrame “new_df” และคำนวณจำนวนค่าที่ขาดหายไปในแต่ละคอลัมน์โดยใช้นิพจน์ sum() ภายในฟังก์ชัน sapply()

ฟังก์ชัน is.na() เป็นนิพจน์ที่ระบุให้กับฟังก์ชัน sum() ซึ่งจะส่งคืนเวกเตอร์เชิงตรรกะเพื่อระบุว่าองค์ประกอบแต่ละรายการในคอลัมน์ขาดหายไปหรือไม่ ฟังก์ชัน sum() บวกค่า TRUE เพื่อนับจำนวนค่าที่ขาดหายไปในแต่ละคอลัมน์

ดังนั้น ผลลัพธ์จะแสดงค่า NA ทั้งหมดในแต่ละคอลัมน์:

ตัวอย่างที่ 5: การใช้ฟังก์ชัน Dim()

นอกจากนี้ เราต้องการรับคอลัมน์ทั้งหมดพร้อมกับแถวของ DataFrame จากนั้น ฟังก์ชัน dim() จะระบุขนาดของ DataFrame ฟังก์ชัน dim() รับวัตถุเป็นอาร์กิวเมนต์ที่มีขนาดที่เราต้องการดึงข้อมูล นี่คือโค้ดสำหรับใช้ฟังก์ชัน dim():

d1 <- data.frame(ทีม=c('t1', 't2', 't3', 't4'),

คะแนน=c(8, 10, 7, 4))

สลัว (d1)

ในตัวอย่างนี้ ขั้นแรก เรากำหนด DataFrame “d1” ที่สร้างขึ้นโดยใช้ฟังก์ชัน data.frame() โดยกำหนดสองคอลัมน์เป็น “team” และ “points” หลังจากนั้น เราเรียกใช้ฟังก์ชัน dim() บน DataFrame “d1” ฟังก์ชัน dim() ส่งคืนจำนวนแถวและคอลัมน์ของ DataFrame ดังนั้น เมื่อเราเรียกใช้ dim(d1) มันจะส่งกลับเวกเตอร์ที่มีสององค์ประกอบ โดยองค์ประกอบแรกแสดงถึงจำนวนแถวใน DataFrame “d1” และองค์ประกอบที่สองแสดงถึงจำนวนคอลัมน์

ผลลัพธ์แสดงขนาดของ DataFrame โดยที่ค่า '4' ระบุคอลัมน์ทั้งหมด และค่า '2' แสดงถึงแถว:

บทสรุป

ตอนนี้เราได้เรียนรู้ว่าการนับจำนวนคอลัมน์ใน R เป็นการดำเนินการที่ง่ายและสำคัญที่สามารถทำได้บน DataFrame ในบรรดาฟังก์ชันทั้งหมด ฟังก์ชัน ncol() เป็นวิธีที่สะดวกที่สุด ตอนนี้ เราคุ้นเคยกับวิธีต่างๆ ในการรับจำนวนคอลัมน์จาก DataFrame ที่กำหนดแล้ว