รายชื่อหนังสือวิทยาศาสตร์ข้อมูลที่ดีที่สุด 10 เล่มและคำอธิบายสำหรับ Generalist

Ray Chux Hnangsux Withyasastr Khxmul Thi Di Thisud 10 Lem Laea Kha Xthibay Sahrab Generalist



วิทยาศาสตร์ข้อมูลเป็นสาขาวิชาที่จัดการข้อมูลจำนวนมหาศาลโดยใช้วิธีการทางวิทยาศาสตร์ กระบวนการ อัลกอริทึม และระบบเพื่อค้นหารูปแบบที่มองไม่เห็น รับข้อมูลที่มีความหมาย ตัดสินใจทางธุรกิจในบริษัท และใช้ในสถาบันที่ไม่ใช่ธุรกิจ สถาบันที่ไม่ใช่ธุรกิจ ได้แก่ อุตสาหกรรมด้านการดูแลสุขภาพ การเล่นเกม การจดจำรูปภาพ ระบบคำแนะนำ โลจิสติกส์ การตรวจจับการฉ้อโกง (ธนาคารและสถาบันการเงิน) การค้นหาทางอินเทอร์เน็ต การรู้จำเสียง การโฆษณาที่ตรงเป้าหมาย การวางแผนเส้นทางบิน และความเป็นจริงเสริม Data Science เป็นหน่วยย่อยของปัญญาประดิษฐ์ ข้อมูลที่ใช้ในการวิเคราะห์อาจมาจากหลายแหล่งและนำเสนอในรูปแบบต่างๆ แหล่งข้อมูลบางส่วนอาจเป็นมาตรฐาน คนอื่นอาจไม่ได้มาตรฐาน

หากต้องการพูดในอีกทางหนึ่ง จะใช้วิธีการต่างๆ ในการรวบรวมข้อมูล (พหูพจน์ของ Datum) จากนั้น ความรู้ (ข้อสรุปที่มีค่า) จะถูกดึงออกมาจากข้อมูลที่รวบรวมไว้ ในกระบวนการนี้ หลังจากรวบรวมข้อมูลแล้ว การวิจัยจะเสร็จสิ้น (ข้อมูล) เพื่อให้ได้ข้อมูลใหม่ (ผลลัพธ์) ซึ่งแก้ปัญหาได้







วิทยาศาสตร์ข้อมูลเป็นสาขาวิชา (หลัก) มีอยู่ในระดับปริญญาตรีและปริญญาโทที่มหาวิทยาลัย อย่างไรก็ตาม มีมหาวิทยาลัยเพียงไม่กี่แห่งในโลกที่เปิดสอนวิทยาศาสตร์ข้อมูลในระดับปริญญาตรีหรือปริญญาโท ในระดับปริญญาตรี นักศึกษาจะสำเร็จการศึกษาระดับปริญญาด้านวิทยาศาสตร์ข้อมูล นี่เป็นเหมือนระดับวัตถุประสงค์ทั่วไป ในระดับปริญญาโท นักศึกษาจะสำเร็จการศึกษาระดับบัณฑิตศึกษาสาขาวิทยาศาสตร์ข้อมูล ซึ่งเชี่ยวชาญด้านการวิเคราะห์ข้อมูล วิศวกรรมข้อมูล หรือในฐานะนักวิทยาศาสตร์ข้อมูล



อาจทำให้ผู้อ่านประหลาดใจและอาจน่าเสียดายที่ Machine Learning, Modeling, Statistics, Programming และ Databases เป็นความรู้ที่จำเป็นในการศึกษา Data Science ในระดับปริญญาตรี ทั้งๆ ที่ต่างก็เคารพในหลักสูตรของมหาวิทยาลัยในสิทธิ์ของตัวเองที่เรียนมา สาขาวิชาอื่นในระดับปริญญาตรีหรือปริญญาโท อย่างไรก็ตาม เมื่อนักศึกษาไปเรียนที่มหาวิทยาลัยเพื่อศึกษา Data Science ในระดับปริญญา หลักสูตรทั้งหมดเหล่านี้จะยังคงเรียนควบคู่ไปกับหรือก่อนหลักสูตรที่เหมาะสมสำหรับ Data Science



วิทยาศาสตร์ข้อมูลสำหรับปริญญาตรีหรือเฉพาะทางเช่น Data Analytics, Data Engineering หรือ Data Scientist ยังอยู่ในระหว่างการพัฒนา แม้จะถึงขั้นนำไปประยุกต์ใช้ในอุตสาหกรรมได้หลังจากผ่านการศึกษามาแล้ว (ในมหาวิทยาลัย) วิทยาศาสตร์ข้อมูลเป็นสาขาวิชาที่ค่อนข้างใหม่โดยรวม





โปรดจำไว้ว่าคุณควรเป็นนายพลก่อนที่จะเป็นผู้เชี่ยวชาญ ความแตกต่างระหว่างโปรแกรมผู้เชี่ยวชาญยังไม่ชัดเจน ความแตกต่างระหว่างโปรแกรมทั่วไปและโปรแกรมผู้เชี่ยวชาญยังไม่ชัดเจน

เนื่องจากวิทยาศาสตร์ข้อมูลเป็นสาขาวิชาที่ค่อนข้างใหม่ หนังสือที่กำหนดในเอกสารนี้จึงขึ้นอยู่กับความครอบคลุมของเนื้อหา ไม่ใช่การสอน (หนังสือสอนได้ดีเพียงใด) และเป็นหลักสูตรปริญญาตรี (ทั่วไป) มีหลักสูตรทั่วไปที่แตกต่างกัน



รายการ

สำหรับรายละเอียดเพิ่มเติมและการซื้อที่เป็นไปได้ด้วยบัตรเครดิต ไฮเปอร์ลิงก์สำหรับหนังสือแต่ละเล่มจะได้รับ ไม่ใช่หนังสือเล่มใดเล่มหนึ่งที่ครอบคลุมหลักสูตรทั่วไปทั้งหมด

คณิตศาสตร์ที่จำเป็นสำหรับวิทยาศาสตร์ข้อมูล: แคลคูลัส สถิติ ทฤษฎีความน่าจะเป็น และพีชคณิตเชิงเส้น

ผู้เขียน: แฮเดรียน ฌอง

  • สำนักพิมพ์: Hadrien Jean
  • วันที่เผยแพร่: หลัง 30 กันยายน 2563
  • ภาษา: ‎อังกฤษ
  • จำนวนหน้า: ‎มากกว่า 400

เนื้อหาของหนังสือเล่มนี้สามารถเห็นได้ว่าเป็นหลักสูตรคณิตศาสตร์สำหรับวิทยาศาสตร์ข้อมูล แม้ว่าจะไม่แนะนำให้เรียนรู้ Data Science ด้วยตัวเอง แต่ผู้สำเร็จการศึกษาระดับมัธยมศึกษาตอนปลายที่ต้องการเรียนรู้ Data Science ด้วยตัวเองควรเริ่มต้นด้วยหนังสือเล่มนี้

เนื้อหา: แคลคูลัส; สถิติและความน่าจะเป็น พีชคณิตเชิงเส้น; สเกลาร์และเวกเตอร์; เมทริกซ์และเทนเซอร์ ช่วง การพึ่งพาเชิงเส้น และการแปลงอวกาศ ระบบสมการเชิงเส้น ค่าลักษณะเฉพาะและค่าลักษณะเฉพาะ การสลายตัวของค่าเอกพจน์

https://www.essentialmathfordatascience.com/

คู่มือสามัญสำนึกเกี่ยวกับโครงสร้างข้อมูลและอัลกอริทึม: ยกระดับทักษะการเขียนโปรแกรมหลักของคุณ / ฉบับที่ 2

เขียนบทโดย: เจย์ เวนโกรว์

  • สำนักพิมพ์: ชั้นวางหนังสือ Pragmatic
  • วันที่เผยแพร่: 15 กันยายน 2020
  • ภาษา: ‎อังกฤษ
  • ขนาด: 7.5 x 1.25 x 9.25 นิ้ว
  • จำนวนหน้า: ‎508

หนังสือเล่มนี้เกี่ยวข้องกับอัลกอริทึมและโครงสร้างข้อมูลที่ใช้ในวิทยาศาสตร์ข้อมูล สมมติว่ามีคนเรียน Data Science ด้วยตัวเองหลังจากจบมัธยมปลาย นี่คือหนังสือเล่มต่อไปที่จะอ่านหลังจากอ่านหนังสือคณิตศาสตร์เล่มที่แล้ว โปรแกรมตัวอย่างมีให้ใน JavaScript, Python และ Ruby

เนื้อหา: เหตุใดโครงสร้างข้อมูลจึงมีความสำคัญ ทำไมอัลกอริทึมจึงมีความสำคัญ โอ้ใช่! สัญกรณ์บิ๊กโอ; เร่งรหัสของคุณด้วย Big O; การปรับโค้ดให้เหมาะสมโดยมีและไม่มี Big O; การเพิ่มประสิทธิภาพสำหรับสถานการณ์ที่มองโลกในแง่ดี; Big O ในรหัสทุกวัน; ค้นหาอย่างรวดเร็วด้วยตารางแฮช; การสร้างรหัสที่หรูหราด้วยสแต็คและคิว; เรียกซ้ำด้วยการเรียกซ้ำ; เรียนรู้การเขียนแบบเรียกซ้ำ การเขียนโปรแกรมแบบไดนามิก อัลกอริทึมแบบเรียกซ้ำสำหรับความเร็ว; โครงสร้างข้อมูลตามโหนด เร่งความเร็วทุกสิ่งด้วย Binary Search Tree; รักษาลำดับความสำคัญของคุณให้ตรงด้วย Heaps; ไม่เจ็บที่จะลอง; เชื่อมโยงทุกอย่างด้วยกราฟ การจัดการกับข้อจำกัดของพื้นที่ เทคนิคการเพิ่มประสิทธิภาพรหัส

วิทยาศาสตร์ข้อมูลที่ชาญฉลาดขึ้น: ประสบความสำเร็จด้วยข้อมูลระดับองค์กรและโครงการ AI / 1 เซนต์ แก้ไข

เขียนบทโดย: นีล ฟิชแมน, โคล สไตรเกอร์ และเกรดี้ บูช

  • สำนักพิมพ์: ไวลีย์
  • วันที่เผยแพร่: 14 เมษายน 2020
  • ภาษา: ‎อังกฤษ
  • จำนวนหน้า: ‎286

เนื้อหา: ปีนบันได AI; กรอบส่วนที่ 1: ข้อควรพิจารณาสำหรับองค์กรที่ใช้ AI; การจัดกรอบส่วนที่ II: ข้อพิจารณาสำหรับการทำงานกับข้อมูลและ AI; มองย้อนกลับไปในการวิเคราะห์: มากกว่าหนึ่งค้อน; มองไปข้างหน้าเกี่ยวกับการวิเคราะห์: ไม่ใช่ทุกสิ่งที่สามารถเป็นเล็บได้ การระบุระเบียบวินัยในการปฏิบัติงานบนบันได AI การใช้ข้อมูลของคุณให้เกิดประโยชน์สูงสุด: ขับเคลื่อนด้วยคุณค่า; การประเมินค่าข้อมูลด้วยการวิเคราะห์ทางสถิติและการเปิดใช้งานการเข้าถึงที่มีความหมาย; การสร้างระยะยาว จุดสิ้นสุดของการเดินทาง: IA สำหรับ AI

การเรียนรู้ของเครื่อง: มุมมองที่น่าจะเป็น (ชุดการคำนวณแบบปรับตัวและการเรียนรู้ของเครื่อง) ฉบับภาพประกอบ

เขียนโดย: เควิน พี. เมอร์ฟี

  • สำนักพิมพ์: สำนักพิมพ์เอ็มไอที
  • วันที่เผยแพร่: 24 สิงหาคม 2555
  • ภาษา: ‎อังกฤษ
  • ขนาด: 8.25 x 1.79 x 9.27 นิ้ว
  • จำนวนหน้า: ‎1104

หนังสือเล่มนี้เหมาะสำหรับผู้เริ่มต้น เช่นเดียวกับหนังสืออื่นๆ ทั้งหมดที่กำหนดไว้ในเอกสารนี้ หนังสือเล่มนี้ไม่ได้ครอบคลุมทุกสิ่งที่จำเป็นสำหรับหลักสูตรทั่วไป ซึ่งน่าเสียดายที่ยังไม่สิ้นสุด (โปรแกรมผู้เชี่ยวชาญยังไม่สิ้นสุดเช่นกัน) ผู้เริ่มต้นโดยทั่วไปคือผู้สำเร็จการศึกษาระดับมัธยมศึกษาตอนปลายที่สอบผ่านวิชาคณิตศาสตร์และวิทยาการคอมพิวเตอร์

เนื้อหา: บทนำ (แมชชีนเลิร์นนิง: อะไรและทำไม การเรียนรู้แบบไม่มีผู้ดูแล แนวคิดพื้นฐานบางประการในแมชชีนเลิร์นนิง); ความน่าจะเป็น; แบบจำลองเชิงกำเนิดสำหรับข้อมูลแยกส่วน โมเดลเกาส์เซียน; สถิติแบบเบส์; สถิติผู้ที่มาบ่อย การถดถอยเชิงเส้น การถดถอยโลจิสติก; แบบจำลองเชิงเส้นทั่วไปและตระกูลเอกซ์โปเนนเชียล แบบจำลองกราฟิกกำกับ (Bayes nets); แบบจำลองส่วนผสมและอัลกอริธึม EM; แบบจำลองเชิงเส้นแฝง แบบจำลองเชิงเส้นแบบกระจาย เมล็ดพืช; กระบวนการเกาส์เซียน แบบจำลองฟังก์ชันพื้นฐานที่ปรับเปลี่ยนได้ มาร์คอฟและโมเดลมาร์คอฟที่ซ่อนอยู่ แบบจำลองอวกาศของรัฐ โมเดลกราฟิกที่ไม่มีทิศทาง (ฟิลด์สุ่มของ Markov); การอนุมานที่แน่นอนสำหรับแบบจำลองกราฟิก การอนุมานแบบแปรผัน การอนุมานแบบแปรผันเพิ่มเติม การอนุมานของมอนติคาร์โล; การอนุมานของ Markov chain Monte Carlo (MCMC); การรวมกลุ่ม; การเรียนรู้โครงสร้างแบบจำลองกราฟิก แบบจำลองตัวแปรแฝงสำหรับข้อมูลแยก การเรียนรู้อย่างลึกซึ้ง

วิทยาศาสตร์ข้อมูลสำหรับธุรกิจ: สิ่งที่คุณต้องรู้เกี่ยวกับการขุดข้อมูลและการคิดวิเคราะห์ข้อมูล / ฉบับที่ 1

เขียนโดย: Tom Fawcett และ Foster Provost

  • สำนักพิมพ์: O'Reilly Media
  • วันที่เผยแพร่: 17 กันยายน 2556
  • ภาษา: ‎อังกฤษ
  • ขนาด: 7 x 0.9 x 9.19 นิ้ว
  • จำนวนหน้า: ‎413

เนื้อหา: การคิดวิเคราะห์ข้อมูล; ปัญหาทางธุรกิจและโซลูชันด้านวิทยาศาสตร์ข้อมูล ข้อมูลเบื้องต้นเกี่ยวกับการสร้างแบบจำลองเชิงทำนาย: จากสหสัมพันธ์ไปจนถึงการแบ่งกลุ่มภายใต้การดูแล; การปรับโมเดลให้เข้ากับข้อมูล มากเกินไปและการหลีกเลี่ยง; ความคล้ายคลึง เพื่อนบ้าน และคลัสเตอร์ การคิดเชิงวิเคราะห์เพื่อการตัดสินใจ I: ตัวแบบที่ดีคืออะไร?; การแสดงประสิทธิภาพของแบบจำลอง หลักฐานและความน่าจะเป็น การเป็นตัวแทนและการขุดข้อความ การคิดเชิงวิเคราะห์เพื่อการตัดสินใจ II: สู่วิศวกรรมวิเคราะห์; งานและเทคนิคด้านวิทยาศาสตร์ข้อมูลอื่น ๆ วิทยาศาสตร์ข้อมูลและกลยุทธ์ทางธุรกิจ บทสรุป.

https://www.amazon.com/Data-Science-Business-Data-Analytic-Thinking/dp/B08VL5K5ZX

สถิติเชิงปฏิบัติสำหรับนักวิทยาศาสตร์ข้อมูล: แนวคิดสำคัญกว่า 50 แนวคิดโดยใช้ R และ Python / รุ่นที่ 2

เขียนบทโดย: ปีเตอร์ บรูซ, แอนดรูว์ บรูซ และปีเตอร์ เกดเด็ค

  • สำนักพิมพ์: O'Reilly Media
  • วันที่เผยแพร่: 2 มิถุนายน 2020
  • ภาษา: ‎อังกฤษ
  • ขนาด: 7 x 0.9 x 9.1 นิ้ว
  • จำนวนหน้า: ‎368

เนื้อหา: การวิเคราะห์ข้อมูลเชิงสำรวจ การแจกแจงข้อมูลและการสุ่มตัวอย่าง การทดลองทางสถิติและการทดสอบนัยสำคัญ การถดถอยและการทำนาย การจำแนกประเภท การเรียนรู้ของเครื่องทางสถิติ การเรียนรู้แบบไม่มีผู้ดูแล

หนังสือว่าทำไม: ศาสตร์ใหม่ของเหตุและผล

เขียนบทโดย: จูเดีย เพิร์ล, ดาน่า แมคเคนซี

  • สำนักพิมพ์: หนังสือพื้นฐาน
  • วันที่เผยแพร่: 15 พฤษภาคม 2018
  • ภาษา: ‎อังกฤษ
  • ขนาด: 6.3 x 1.4 x 9.4 นิ้ว
  • จำนวนหน้า: ‎432

ในขณะที่หนังสือ Data Science หลายเล่มใช้อุตสาหกรรมธุรกิจล้วนเป็นภาพประกอบ หนังสือเล่มนี้ใช้อุตสาหกรรมการแพทย์และสาขาวิชาอื่นๆ เป็นภาพประกอบ

เนื้อหา: บทนำ: คำนึงถึงข้อมูล; บันไดแห่งเหตุ; จาก Buccaneers ถึง Guinea Pigs: การกำเนิดของการอนุมานเชิงสาเหตุ; จากหลักฐานถึงสาเหตุ: สาธุคุณเบย์สพบคุณโฮล์มส์; ก่อกวนและทำให้เสื่อมเสีย: หรือการสังหารตัวแปรที่ซุ่มซ่อน; การอภิปรายที่เต็มไปด้วยควัน: การล้างอากาศ; Paradoxes มากมาย!; นอกเหนือจากการปรับ: การพิชิตการแทรกแซงของภูเขา; Counterfactuals: การขุดโลกที่เป็นไปได้; การไกล่เกลี่ย: การค้นหากลไก; ข้อมูลขนาดใหญ่ ปัญญาประดิษฐ์ และคำถามสำคัญ

สร้างอาชีพในวิทยาศาสตร์ข้อมูล

เขียนบทโดย: Emily Robinson และ Jacqueline Nolis

  • สำนักพิมพ์: แมนนิ่ง
  • วันที่เผยแพร่: 24 มีนาคม 2020
  • ภาษา: ‎อังกฤษ
  • ขนาด: 7.38 x 0.8 x 9.25 นิ้ว
  • จำนวนหน้า: ‎354

เนื้อหา: การเริ่มต้นกับวิทยาศาสตร์ข้อมูล การหางานด้านวิทยาศาสตร์ข้อมูลของคุณ เข้าสู่วิทยาศาสตร์ข้อมูล เติบโตในบทบาทวิทยาศาสตร์ข้อมูลของคุณ

https://www.manning.com/books/build-a-career-in-data-science

วิทยาศาสตร์ข้อมูลสำหรับ Dummies / ฉบับที่ 2

เขียนโดย: ลิเลียน เพียร์สัน

  • สำนักพิมพ์: สำหรับ Dummies
  • วันที่เผยแพร่: 6 มีนาคม 2017
  • ภาษาอังกฤษ
  • ขนาด: 7.3 x 1 x 9 นิ้ว
  • จำนวนหน้า: ‎384

หนังสือเล่มนี้ถือว่าผู้อ่านมีความรู้พื้นฐานทางคณิตศาสตร์และการเขียนโปรแกรมอยู่แล้ว

เนื้อหา:  ทำความรู้จักกับวิทยาศาสตร์ข้อมูล การสำรวจท่อส่งและโครงสร้างพื้นฐานด้านวิศวกรรมข้อมูล การใช้ข้อมูลเชิงลึกที่ขับเคลื่อนด้วยข้อมูลกับธุรกิจและอุตสาหกรรม การเรียนรู้ของเครื่อง: การเรียนรู้จากข้อมูลด้วยเครื่องของคุณ คณิตศาสตร์ ความน่าจะเป็นและการสร้างแบบจำลองทางสถิติ การใช้การจัดกลุ่มเพื่อแบ่งย่อยข้อมูล การสร้างแบบจำลองด้วยอินสแตนซ์ โมเดลอาคารที่ใช้งานอุปกรณ์อินเทอร์เน็ตในทุกสิ่ง ตามหลักการออกแบบการแสดงข้อมูล การใช้ D3.js สำหรับการแสดงข้อมูล แอปพลิเคชันบนเว็บสำหรับการออกแบบการแสดงภาพ สำรวจแนวทางปฏิบัติที่ดีที่สุดในการออกแบบแดชบอร์ด การสร้างแผนที่จากข้อมูลเชิงพื้นที่ การใช้ Python สำหรับวิทยาศาสตร์ข้อมูล การใช้ Open Source R สำหรับ Data Science; การใช้ SQL ในวิทยาศาสตร์ข้อมูล การทำ Data Science ด้วย Excel และ Knime; วิทยาศาสตร์ข้อมูลในวารสารศาสตร์: ตอกย้ำ Five Ws (และ H); เจาะลึกวิทยาศาสตร์ข้อมูลสิ่งแวดล้อม วิทยาศาสตร์ข้อมูลเพื่อขับเคลื่อนการเติบโตในอีคอมเมิร์ซ; การใช้วิทยาศาสตร์ข้อมูลเพื่ออธิบายและทำนายกิจกรรมทางอาญา สิบทรัพยากรมหัศจรรย์สำหรับข้อมูลเปิด; เครื่องมือและแอปพลิเคชัน Data Science ฟรี 10 รายการ

การขุดชุดข้อมูลขนาดใหญ่ / 3 แก้ไข

เขียนบทโดย: Jure Leskovec, Anand Rajaraman, Jeffrey David Ullman

  • สำนักพิมพ์: สำนักพิมพ์มหาวิทยาลัยเคมบริดจ์
  • วันที่เผยแพร่: 13 กุมภาพันธ์ 2020
  • ภาษาอังกฤษ
  • ขนาด: 7 x 1 x 9.75 นิ้ว
  • จำนวนหน้า: ‎565

หนังสือเล่มนี้ยังถือว่าผู้อ่านมีความรู้พื้นฐานทางคณิตศาสตร์และการเขียนโปรแกรมอยู่แล้ว

เนื้อหา: การขุดข้อมูล; MapReduce และชุดซอฟต์แวร์ใหม่ อัลกอริทึมโดยใช้ MapReduce; ค้นหารายการที่คล้ายกัน การขุดข้อมูลสตรีม; การวิเคราะห์ลิงค์ ชุดรายการที่พบบ่อย; การรวมกลุ่ม; การโฆษณาบนเว็บ ระบบคำแนะนำ; การขุดกราฟโซเชียลเน็ตเวิร์ก; การลดมิติ การเรียนรู้ของเครื่องขนาดใหญ่

บทสรุป

ความแตกต่างระหว่างโปรแกรมผู้เชี่ยวชาญยังไม่ชัดเจน ความแตกต่างระหว่างโปรแกรมทั่วไปและโปรแกรมผู้เชี่ยวชาญยังไม่ชัดเจน อย่างไรก็ตาม หลังจากอ่านรายชื่อหนังสือที่กำหนดแล้ว ผู้อ่านจะสามารถเข้าใจบทบาทพิเศษของนักวิเคราะห์ข้อมูล วิศวกรรมข้อมูล และนักวิทยาศาสตร์ข้อมูลได้ดีขึ้น แล้วจึงก้าวไปข้างหน้า