Walton Electronics Co., Ltd.
ติดต่อเรา

ชื่อผู้ติดต่อ : Walton-cara

หมายเลขโทรศัพท์ : 15986872308

Free call

การเรียนรู้ของเครื่องต้องใช้หลายขั้นตอน

July 18, 2022

บทนำ

การปรับใช้แมชชีนเลิร์นนิง (ML) เป็นกระบวนการที่มีหลายขั้นตอนโดยเกี่ยวข้องกับการเลือกแบบจำลอง การฝึกอบรมสำหรับงานเฉพาะ ตรวจสอบความถูกต้องด้วยข้อมูลการทดสอบ จากนั้นปรับใช้และติดตามแบบจำลองในการผลิตในที่นี้ เราจะพูดถึงขั้นตอนเหล่านี้และแยกย่อยเพื่อแนะนำให้คุณรู้จักกับ MLML หมายถึงระบบที่สามารถเรียนรู้และปรับปรุงได้โดยไม่มีคำแนะนำที่ชัดเจนระบบเหล่านี้เรียนรู้จากข้อมูลเพื่อทำงานหรือฟังก์ชันเฉพาะในบางกรณีการเรียนรู้หรือการฝึกอบรมเฉพาะเจาะจงมากขึ้น เกิดขึ้นในลักษณะภายใต้การดูแล ซึ่งผลลัพธ์ที่ไม่ถูกต้องส่งผลให้มีการปรับแบบจำลองเพื่อดันไปยังผลลัพธ์ที่ถูกต้องในกรณีอื่นๆ การเรียนรู้โดยไม่ได้รับการดูแลจะเกิดขึ้นโดยที่ระบบจัดระเบียบข้อมูลเพื่อเปิดเผยรูปแบบที่ไม่รู้จักก่อนหน้านี้โมเดล ML ส่วนใหญ่เป็นไปตามกระบวนทัศน์ทั้งสองนี้ (การเรียนรู้แบบมีผู้ดูแลและการเรียนรู้แบบไม่มีผู้ดูแล)ตอนนี้ เรามาเจาะลึกถึงความหมายของแบบจำลอง แล้วสำรวจว่าข้อมูลกลายเป็นเชื้อเพลิงสำหรับการทำงานของเครื่องจักรได้อย่างไรโมเดลการเรียนรู้ของเครื่อง โมเดล A เป็นนามธรรมของโซลูชันสำหรับการเรียนรู้ของเครื่องโมเดลกำหนดสถาปัตยกรรม。 ซึ่งเมื่อผ่านการฝึกอบรมแล้ว จะกลายเป็นการนำไปปฏิบัติดังนั้นเราจึงไม่ปรับใช้โมเดลเราปรับใช้โมเดลที่ได้รับการฝึกอบรมจากข้อมูล (เพิ่มเติมเกี่ยวกับเรื่องนี้ในหัวข้อถัดไป)ดังนั้น โมเดลบวกข้อมูลและการฝึกอบรม อินสแตนซ์ของโซลูชัน ML เท่ากัน (รูปที่ 1)จำเป็นต้องแปลตัวอย่างเช่น การป้อนข้อมูลข้อความลงในเครือข่ายการเรียนรู้เชิงลึกจำเป็นต้องมีการเข้ารหัสคำให้อยู่ในรูปแบบตัวเลขที่โดยทั่วไปแล้วจะเป็นเวกเตอร์มิติสูงโดยให้คำต่างๆ ที่สามารถใช้ได้ในทำนองเดียวกัน ผลลัพธ์อาจต้องมีการแปลจากรูปแบบตัวเลขกลับเป็นรูปแบบข้อความโมเดล ML มีหลายประเภท รวมถึงโมเดลโครงข่ายประสาทเทียม โมเดลเบย์เซียน โมเดลการถดถอย โมเดลคลัสเตอร์ และอื่นๆรุ่นที่คุณเลือกจะขึ้นอยู่กับปัญหาที่มีอยู่ในบริบทของโครงข่ายประสาทเทียม โมเดลมีตั้งแต่เครือข่ายหลายชั้นแบบตื้นไปจนถึงโครงข่ายประสาทแบบลึกที่รวมหลายชั้น

ของเซลล์ประสาทเฉพาะ (หน่วยประมวลผล)โครงข่าย Deep Neural ยังมีรุ่นต่างๆ ให้เลือกตามการใช้งานเป้าหมายของคุณ

ตัวอย่างเช่น:

●หากแอปพลิเคชันของคุณมุ่งเน้นที่การระบุวัตถุภายในรูปภาพ Convolutional Neural Network (CNN) จะเป็นแบบจำลองในอุดมคติมีการใช้ CNN เพื่อตรวจหามะเร็งผิวหนังและได้ผลดีกว่าแพทย์ผิวหนังทั่วไป

●หากแอปพลิเคชันของคุณเกี่ยวข้องกับการทำนายหรือสร้างลำดับที่ซับซ้อน (เช่น ประโยคภาษามนุษย์) ดังนั้น Recurrent Neural Networks (RNN) หรือ Long-Short- Term-Memory networks (LSTM) จึงเป็นแบบจำลองในอุดมคติLSTM ยังถูกนำไปใช้กับการแปลภาษามนุษย์ด้วยเครื่อง

●หากแอปพลิเคชันของคุณเกี่ยวข้องกับการอธิบายเนื้อหาของรูปภาพในภาษามนุษย์ คุณสามารถใช้ CNN และ LSTM ร่วมกันได้ (โดยที่รูปภาพถูกป้อนเข้าสู่ CNN และเอาต์พุตของ CNN แสดงถึงอินพุตของ LSTM ซึ่ง ปล่อยลำดับคำ)

●หากแอปพลิเคชันของคุณเกี่ยวข้องกับการสร้างภาพที่สมจริง (เช่น ทิวทัศน์หรือใบหน้า) Generative Adversarial Network (GAN) จะแสดงโมเดลที่ทันสมัยที่สุดในปัจจุบันโมเดลเหล่านี้แสดงถึงสถาปัตยกรรมโครงข่ายประสาทเทียมระดับลึกซึ่งเป็นที่นิยมใช้กันในปัจจุบันเครือข่าย Deep Neural ได้รับความนิยมเนื่องจากสามารถรับข้อมูลที่ไม่มีโครงสร้าง เช่น ข้อมูลรูปภาพ วิดีโอ หรือเสียงเลเยอร์ภายในเครือข่ายสร้างลำดับชั้นของคุณลักษณะที่ช่วยให้พวกเขาสามารถจำแนกข้อมูลที่ซับซ้อนมากได้โครงข่าย Deep Neural ได้แสดงให้เห็นถึงประสิทธิภาพที่ล้ำหน้าเหนือขอบเขตของปัญหาจำนวนมากแต่เช่นเดียวกับ ML รุ่นอื่นๆ ความแม่นยำจะขึ้นอยู่กับข้อมูลลองสำรวจแง่มุมนี้ต่อไป

ข้อมูลและการฝึกอบรม

ข้อมูลเป็นเชื้อเพลิงที่ขับเคลื่อนการเรียนรู้ของเครื่อง ไม่เพียงแต่ในการใช้งานเท่านั้น แต่ยังสร้างโซลูชัน ML ผ่านการฝึกแบบจำลองอีกด้วยในบริบทของข้อมูลการฝึกอบรมสำหรับโครงข่ายประสาทเทียมระดับลึก การสำรวจข้อมูลที่จำเป็นในบริบทของปริมาณและคุณภาพเป็นสิ่งสำคัญDeep Neural Network ต้องการข้อมูลจำนวนมากสำหรับการฝึกอบรมกฎง่ายๆ ประการหนึ่งสำหรับการจัดประเภทตามรูปภาพคือ 1,000 ภาพ

ต่อชั้นเรียนแต่คำตอบนั้นขึ้นอยู่กับความซับซ้อนของแบบจำลองและความทนทานต่อข้อผิดพลาดตัวอย่างบางส่วนจากโซลูชัน ML ที่ใช้งานจริงให้สเปกตรัมของขนาดชุดข้อมูลระบบตรวจจับใบหน้าและจดจำใบหน้าต้องใช้ภาพ 450,000 ภาพ และแชทบ็อตคำถามและคำตอบได้รับการฝึกฝนด้วยคำถาม 200,000 คำถาม จับคู่กับ 2 ล้านคำตอบชุดข้อมูลที่เล็กลงก็เพียงพอแล้วโดยพิจารณาจากปัญหาที่กำลังแก้ไขโซลูชันการวิเคราะห์ความรู้สึกที่กำหนดขั้วของความคิดเห็นจากข้อความที่เขียนนั้นต้องการตัวอย่างเพียงหลายหมื่นตัวอย่างคุณภาพของข้อมูลมีความสำคัญพอๆ กับปริมาณด้วยชุดข้อมูลขนาดใหญ่ที่จำเป็นสำหรับการฝึกอบรม ข้อมูลการฝึกอบรมที่ผิดพลาดเพียงเล็กน้อยก็อาจนำไปสู่โซลูชันที่ไม่ดีได้ข้อมูลของคุณอาจผ่านกระบวนการล้างข้อมูล ทั้งนี้ขึ้นอยู่กับประเภทของข้อมูลที่จำเป็นเพื่อให้แน่ใจว่าชุดข้อมูลมีความสอดคล้อง ไม่มีข้อมูลที่ซ้ำกัน ถูกต้อง และสมบูรณ์ (ไม่มีข้อมูลที่ไม่ถูกต้องหรือไม่สมบูรณ์)มีเครื่องมือเพื่อรองรับกระบวนการนี้การตรวจสอบความถูกต้องของข้อมูลสำหรับความลำเอียงก็เป็นสิ่งสำคัญเช่นกันเพื่อให้แน่ใจว่าข้อมูลจะไม่นำไปสู่โซลูชัน ML ที่มีอคติการฝึกอบรม ML ดำเนินการกับข้อมูลที่เป็นตัวเลข ดังนั้นจึงจำเป็นต้องมีขั้นตอนก่อนการประมวลผล ทั้งนี้ขึ้นอยู่กับโซลูชันของคุณตัวอย่างเช่น หากข้อมูลของคุณเป็นภาษามนุษย์ จะต้องแปลข้อมูลเป็นรูปแบบตัวเลขก่อนจึงจะประมวลผลได้สามารถประมวลผลภาพล่วงหน้าเพื่อความสอดคล้องตัวอย่างเช่น รูปภาพที่ป้อนเข้าไปในโครงข่ายประสาทเทียมระดับลึกจะถูกปรับขนาดและปรับให้เรียบเพื่อขจัดสัญญาณรบกวน (ในการดำเนินการอื่นๆ)ปัญหาที่ใหญ่ที่สุดใน ML คือการได้มาซึ่งชุดข้อมูลเพื่อฝึกโซลูชัน ML ของคุณนี่อาจเป็นความพยายามที่ใหญ่ที่สุดขึ้นอยู่กับปัญหาของคุณเพราะอาจไม่มีอยู่จริงและต้องใช้ความพยายามแยกต่างหาก

ที่จะจับสุดท้าย ควรแบ่งชุดข้อมูลระหว่างข้อมูลการฝึกและข้อมูลการทดสอบส่วนการฝึกอบรมใช้เพื่อฝึกโมเดล และเมื่อฝึกแล้ว ข้อมูลการทดสอบจะใช้เพื่อตรวจสอบความถูกต้องของโซลูชัน

 

ติดต่อกับพวกเรา

ป้อนข้อความของคุณ