الفلك

قواعد البيانات الفلكية للتعلم الآلي؟

قواعد البيانات الفلكية للتعلم الآلي؟

كنت أقرأ هذا السؤال حول المشاكل المفتوحة في علم الفلك. الجواب الحاصل على المكافأة يقول ذلك

لقد غادرت للتو المجال حيث يحاول بعض الزملاء تطوير بعض البرامج لاستخدام تقنيات طرح الصور لعزل النجوم الفردية في مركز المجموعات.

أجد هذه المشكلة مثيرة للاهتمام. أين يمكنني أن أجد قواعد بيانات للصور الفلكية لاختبار أنواع مختلفة من تقنيات ML لحل مثل هذه المشاكل؟


يحتوي المرصد الأوروبي الجنوبي على كتالوجات ببيانات الصور المتاحة من http://www.eso.org/qi/ ، سيتعين عليك التسجيل قبل أن تتمكن من الوصول إليها.

أود أن أقترح عليك إلقاء نظرة على مواقع المرصد الأخرى للحصول على بياناتها. سيتعين عليك إلقاء نظرة على الصفحات المستهدفة لعامة الناس والعثور على روابط للبيانات أو العلوم أو بوابة المستخدم أو شيء من هذا القبيل. في بعض الأحيان يصعب العثور عليهم.

من الناحية المثالية ، سيكون لديك مجموعة بيانات مشروحة قياسية من الصور لتصنيفها حتى تتمكن من مقارنة نتائجك بالآخرين. لسوء الحظ ، لست على علم بأي مجموعات قياسية.

بالنسبة إلى الأدبيات المتعلقة باستخدام التعرف على الأنماط على الصور الفلكية ، يعد http://astrometry.net/biblio.html مصدرًا جيدًا. لقد أنشأوا نظام ML ليس فقط قادرًا على تمييز النجوم عن فئات الكائنات الأخرى ولكن أيضًا قادر على تحديد النجوم المرئية في الصورة! بحث مثير جدا للاهتمام.

ملحوظة: لتصنيف النجوم في عناقيد ، المشكلة على الأرجح ليست التصنيف ، ولكن المزيد من التجزئة.


دكتور روب ليون


مرحبًا ، أنا & # 8217m روب. أنا & # 8217m محاضرًا في الذكاء الاصطناعي والروبوتات في جامعة إيدج هيل. تشمل اهتماماتي البحثية التعلم الآلي في الوقت الفعلي ومعالجة تدفق البيانات ومشكلات التعلم الآلي غير المتوازن. أنا & # 8217m الباحث الرئيسي لمشروع ممول من STFC يهدف إلى استخدام أساليب ML لتحسين العلاج الإشعاعي. أقوم أيضًا بإجراء بحث ML خالص للعديد من التعاون العلمي الدولي الذي أنا & # 8217m جزء منه. الآن أنا & # 8217m أشرف على طالب دكتوراه مع البروفيسور بن ستابيرز (جامعة مانشستر).

منذ عام 2015 ، كنت أساعد في تصميم أكبر تلسكوب لاسلكي في العالم ، وهو مصفوفة الكيلومتر المربع (SKA). كنت جزءًا من اتحادات تصميم معالج الإشارة المركزي (CSP) ومعالج البيانات العلمية (SDP) ، وما زلت أشارك في جوانب التعلم الآلي لهذه المشاريع.

السيرة الذاتية

يمكن الاطلاع على نسخة عامة من سيرتي الذاتية هنا.

خلفيتي

أنا حاصل على بكالوريوس. في هندسة البرمجيات (مع مرتبة الشرف الأولى) ، وماجستير. ماجستير في علوم الكمبيوتر المتقدمة (بامتياز) ، وكلاهما حصل عليهما من جامعة ليفربول. كما أنني حاصل على درجة الدكتوراه. في التعلم الآلي ، تم الحصول عليها من جامعة مانشستر. في الماضي ، عملت كمهندس برمجيات للأداء وقابلية التوسع ، ولقد تطوعت أيضًا كسفير للعلوم في مجالات العلوم والتكنولوجيا والهندسة والرياضيات (STEM).

قضيت أربع سنوات كباحث ما بعد الدكتوراه في جامعة مانشستر. خلال هذا الوقت عملت على إنشاء خوارزميات ذكية قادرة على مساعدة علماء الفلك في تحقيق اكتشافات جديدة مثيرة للاهتمام وهامة. كان هذا العمل متعدد التخصصات للغاية. لقد جمعت بين هندسة البرمجيات وعلوم البيانات والتعلم الآلي وعلم الفلك الراديوي. لقد ساعدت حتى الآن زملائي في اكتشاف أكثر من 20 نجمًا نابضًا جديدًا (زيادة بنسبة 1٪ في عدد النجوم النابضة المعروفة). ومن المتوقع أن يرتفع هذا الرقم في السنوات القادمة.

أنا & # 8217m من ليفيربودليان فخور (من بلدة تسمى كيركبي) ، ومهوس بالعلوم بالكامل ، ومشجع رياضي كبير.


اكتشاف المعرفة في البيانات الضخمة من علم الفلك ورصد الأرض

اكتشاف المعرفة في البيانات الضخمة من علم الفلك ورصد الأرض: المعلوماتية الفلكية يسد الفجوة بين علم الفلك وعلم الأرض في سياق التطبيقات والتقنيات والمبادئ الأساسية للبيانات الضخمة. أصبح التعلم الآلي والحوسبة الموازية متعددة التخصصات بشكل متزايد حيث أصبحت ظاهرة البيانات الضخمة مكانًا شائعًا. يقدم هذا الكتاب نظرة ثاقبة حول تدفقات العمل الشائعة وأدوات علم البيانات المستخدمة في البيانات الضخمة في علم الفلك وعلم الأرض. بعد إثبات التشابه في جمع البيانات والمعالجة المسبقة والمعالجة ، يتم توضيح جوانب علم البيانات في سياق كلا المجالين. يتم تناول البرامج والأجهزة والخوارزميات الخاصة بالبيانات الضخمة.

أخيرًا ، يقدم الكتاب نظرة ثاقبة في العلوم الناشئة التي تجمع بين البيانات والخبرة من كلا المجالين في دراسة تأثير الكون على الأرض وسكانها.

اكتشاف المعرفة في البيانات الضخمة من علم الفلك ورصد الأرض: المعلوماتية الفلكية يسد الفجوة بين علم الفلك وعلم الأرض في سياق التطبيقات والتقنيات والمبادئ الأساسية للبيانات الضخمة. أصبح التعلم الآلي والحوسبة الموازية متعددة التخصصات بشكل متزايد حيث أصبحت ظاهرة البيانات الضخمة مكانًا شائعًا. يقدم هذا الكتاب نظرة ثاقبة حول تدفقات العمل الشائعة وأدوات علم البيانات المستخدمة في البيانات الضخمة في علم الفلك وعلم الأرض. بعد إثبات التشابه في جمع البيانات والمعالجة المسبقة والمعالجة ، يتم توضيح جوانب علم البيانات في سياق كلا المجالين. يتم تناول البرامج والأجهزة والخوارزميات الخاصة بالبيانات الضخمة.

أخيرًا ، يقدم الكتاب نظرة ثاقبة في العلوم الناشئة التي تجمع بين البيانات والخبرة من كلا المجالين في دراسة تأثير الكون على الأرض وسكانها.


مستقبل الذكاء الاصطناعي في علم الفلك

إن مستقبل الذكاء الاصطناعي في علم الفلك ليس مشرقًا كما يراه البعض ، كما أنه ليس مستقبلًا مظلمًا كما يراه البعض. لا يزال من السهل تخيل العديد من المجالات. لا يزالون خارج صميم علم الفلك ، حيث يمكن للتكنولوجيا أن تلعب دورًا في المستقبل. سيتطلب التعقيد المتزايد لأنظمة الكمبيوتر واجهات أفضل بين الإنسان والحاسوب. ومع ذلك ، يبدو أن عمليات المراقبة الأرضية تزداد تعقيدًا ويمكن أن تصل أيضًا إلى ما هو أبعد من المستوى الذي يمكن للبشر التعامل معه بسرعة وموثوقية.

ستصبح إجراءات مراقبة الغياب وتقسيم الجدول الزمني أكثر شيوعًا. يمكن تسهيل الجمع بين عمليات رصد التردد المتعددة ، والتي تتطلب تنسيق قواعد أرضية متعددة وعمليات رصد عبر الأقمار الصناعية ، بمساعدة الجدولة الحديثة. ستتطلب البعثات الكوكبية المخطط لها ، إذا تم تمويلها من أي وقت مضى ، قدرات مراقبة مستقلة. يمكن جعل التحكم التكيفي في البصريات التلسكوبية "المرنة" أو تحسين الصفوف التلسكوبية ممكنًا باستخدام الشبكات العصبية. ويرتبط بمحتوى البيانات من قواعد بيانات الصور الكبيرة.


قواعد البيانات الفلكية للتعلم الآلي؟ - الفلك

قريباً سوف يقوم تلسكوب جديد في تشيلي بمسح السماء ليلاً بشكل أكثر شمولاً من أي وقت مضى ، وتصوير السماء بأكملها كل ثلاثة أيام ، والنظر في أعماق الكون بفضل المرآة التي يبلغ ارتفاعها ثمانية أمتار. على الرغم من أنه يعد موردًا رائعًا لمجتمع علم الفلك ، فإن اكتشاف أفضل طريقة للاستفادة من التدفق شبه المستمر للبيانات القادمة من التلسكوب ، سيكون تحديًا & # 8211 يتعامل معه فريق Purdue بمساعدة ITaP موارد الحوسبة البحثية. & # 160

عمل دان ميليسافليفيتش ، الأستاذ المساعد للفيزياء وعلم الفلك وشريكته في مرحلة ما بعد الدكتوراه ، نيهاريكا سرافان ، مع جيفري لينتنر ، عالم البيانات في مجال الحوسبة البحثية ، لتطوير أداة ، محرك التوصية للتتبع الذكي العابر (REFITT) الذي سيمتص التلسكوب وتنبيهات # 8217 حول الأحداث الفلكية الشيقة ، واكتشف أيها يستحق المتابعة.

يشبه ميليسافليفيتش ، الذي يدرس المستعرات الأعظمية ، أو الانفجارات الضخمة للنجوم ، تدفق البيانات الذي سيأتي من مرصد فيرا روبين & # 8217s Legacy Survey of Space and Time (LSST) بفتح صنبور إطفاء الحرائق. في حين أن التلسكوبات الحالية تعثر على المستعرات الأعظمية بمعدل بضعة آلاف في السنة ، فمن المتوقع أن يجد تلسكوب روبن هذا العدد كل يوم.

يستوعب REFITT جميع البيانات الواردة من التلسكوب ويستخدم خوارزمية التعلم الآلي والجوانب المعروفة لسلوك المستعر الأعظم لعمل استنتاجات احتمالية حول الأحداث ، مما يمنح المستخدم نظرة ثاقبة للأحداث التي يجب دراستها بشكل أكبر وكيف.

اعتمد الفريق بشكل كبير على مجموعة مجتمع براون ، والتي تناسب بشكل خاص تطبيقات التعلم الآلي ، لتطوير وتدريب الخوارزميات الخاصة بهم ، ونسخ بياناتهم احتياطيًا إلى أرشيف Fortress.

& # 8220 لقد كنت متحمسًا للانضمام إلى جامعة بيرديو ، مع العلم أن لدينا الكثير من الموارد المخصصة لإنجاز العلم ، & # 8221 يقول سرافان ، الذي يتمتع بخلفية في علم البيانات وعلم الفلك الحسابي.

سيشمل مشروع REFITT أيضًا علماء من المواطنين ، فيما يصفه Milisavljevic بأنه & # 8220crowdsourcing Earth لمشاهدة الكون. & # 8221 الهدف هو إعطاء العديد من علماء الفلك الهواة هناك إرشادات حول أفضل مكان لهم لتوجيه التلسكوبات الخاصة بهم ، والقضاء على التكرار والتأكد من أن أكبر عدد ممكن من الأحداث السماوية الممتعة يكون هناك شخص يراقبها.


علم الفلك القائم على البيانات

يمر العلم بانفجار البيانات ، وعلم الفلك هو الذي يقود الطريق. تنتج التلسكوبات الحديثة تيرابايت من البيانات لكل ملاحظة ، والمحاكاة المطلوبة لنمذجة كوننا المرئي تدفع الحواسيب العملاقة إلى أقصى حدودها. لتحليل هذه البيانات ، يحتاج العلماء إلى أن يكونوا قادرين على التفكير بطريقة حسابية لحل المشكلات. في هذه الدورة التدريبية ، ستتحقق من تحديات العمل مع مجموعات البيانات الكبيرة: كيفية تنفيذ الخوارزميات التي تعمل على كيفية استخدام قواعد البيانات لإدارة بياناتك وكيفية التعلم من بياناتك باستخدام أدوات التعلم الآلي. ينصب التركيز على المهارات العملية - سيتم تنفيذ جميع الأنشطة في Python 3 ، وهي لغة برمجة حديثة مستخدمة في جميع أنحاء علم الفلك.

بغض النظر عما إذا كنت بالفعل عالمًا ، أو تدرس لتصبح واحدًا ، أو مهتمًا فقط بكيفية عمل علم الفلك الحديث "تحت غطاء محرك السيارة" ، ستساعدك هذه الدورة على استكشاف علم الفلك: من الكواكب إلى النجوم النابضة إلى الثقوب السوداء. مخطط الدورة التدريبية: الأسبوع الأول: التفكير في البيانات - مبادئ التفكير الحسابي - اكتشاف النجوم النابضة في الصور الراديوية الأسبوع الثاني: البيانات الضخمة تجعل الأشياء بطيئة - كيفية حساب التعقيد الزمني للخوارزميات - استكشاف الثقوب السوداء في مراكز المجرات الضخمة أسبوع 3: الاستعلام عن البيانات باستخدام SQL - كيفية استخدام قواعد البيانات لتحليل بياناتك - التحقيق في الكواكب الخارجية في أنظمة الطاقة الشمسية الأخرى الأسبوع 4: إدارة بياناتك - كيفية إعداد قواعد البيانات لإدارة بياناتك - استكشاف دورة حياة النجوم في Galaxy Week 5: التعلم من البيانات: الانحدار - استخدام أدوات التعلم الآلي لاستقصاء بياناتك - حساب الانزياح الأحمر للمجرات البعيدة الأسبوع السادس: التعلم من البيانات: التصنيف - استخدام أدوات التعلم الآلي لتصنيف بياناتك - استكشاف أنواع مختلفة من المجرات سيكون لكل أسبوع أيضًا مجموعة مقابلة مع خبير علم الفلك المستند إلى البيانات. لاحظ أنه يتم افتراض بعض المعرفة ببايثون ، بما في ذلك المتغيرات وهياكل التحكم وهياكل البيانات والوظائف والعمل مع الملفات.


في هذا المساق ، سيتم تدريب الطلاب على المهارات السلوكية التالية:

حل المشكلات (التعرف على المشكلات وتحليلها ، التفكير الموجه نحو الحلول)

المهارات التحليلية (التفكير التحليلي والتجريد والأدلة)

التفكير المنظم (الهيكل ، التفكير المعدل ، التفكير الحسابي ، البرمجة)

مهارات تكنولوجيا المعلومات والاتصالات المعقدة (تحليل البيانات ، البرمجة ، المحاكاة ، تطبيقات تكنولوجيا المعلومات والاتصالات المعقدة)

المسؤولية (الملكية ، الانضباط الذاتي ، تحمل الأخطاء ، المساءلة)

التنظيم الذاتي (الاستقلال ، احترام الذات ، إدراك الأهداف والدوافع والقدرات الخاصة)


1–25 из 307 отзывов о курсе علم الفلك المستند إلى البيانات

لقد أنهيت هذه الدورة اليوم. إذا كنت ترغب في تعلم مفاهيم متقدمة مثل التعلم الآلي ، وتصنيف شجرة القرار ، و SQL ، وأكثر من ذلك ، فهذه هي الدورة المناسبة لك! أنا & # 39m طالب في المدرسة الثانوية ، وسأخصص في الفيزياء الفلكية. إذا كنت تحب علوم الكمبيوتر ، فستكون هذه دورة ممتعة ، حيث ستعرض تطبيقات علوم الكمبيوتر في علم الفلك.

لقد كنت مدمنًا على علم الفلك منذ أن كنت مراهقًا ، لكن بالتفكير في المال ، كان لدي خلفية في علوم الكمبيوتر. الآن بعد أن اكتشفت الكون الرائع لعلوم البيانات وخاصة ارتباطه بكيفية تقدم علم الفلك معه ، أعتقد أنني عدت تمامًا لدراسة كوننا الرائع.

هذه دورة جيدة الإعداد. لقد أكملت أسبوعًا واحدًا وأحببت مزيجًا من الرياضيات وعلم الفلك والأدوات! محتوى الدورة التدريبية ليس قديمًا ، وهو أمر مهم حقًا لمجال مثل هذا.

الدورة بسيطة للغاية بالنسبة لشخص يعمل كمبرمج في علم البيانات. ومع ذلك ، فهو مثير جدًا للاهتمام لمن لم يرَ البيانات الفلكية ويريد إجراء بعض التحليلات القصيرة.

تم بذل قدر كبير من الجهد في تصميم هذه الدورة. أرفع قبعتي للمدربين الذين صمموا وشاركوا في هذه الدورة بالإضافة إلى الموجهين الذين كانوا في أعماق الأعشاب معنا في الكود الخاص بنا. مع قدر كبير من الجهد من جانبك سوف تتعلم الكثير.

أكبر مشكلة فردية في علم الفلك المستند إلى البيانات هي إدارة مجموعات البيانات الضخمة وتحليلها. من البداية ، سوف تتعلم المزيد عن توسيع الخوارزميات لمعالجة حجم مجموعات البيانات بكفاءة. هذا هو موضوع رئيسي في علوم الكمبيوتر.

سوف تتعلم قدرًا كبيرًا من علم الفلك من الكواكب الخارجية إلى مورفولوجيا المجرة. المادة متطورة ولا ترعى الطالب. إنه صعب ومجزٍ!

معرفتي ببايثون صدئة لأنني كنت أركز على R في العام الماضي. سوف تتعلم المزيد من وحدات Python و NumPY و matplotlib و Astropy.

المحاضرات مدروسة وعميقة. أدلى المدربون بتعليقات مثيرة للاهتمام حول طبيعة العلم وتحديات علم الفلك.

لا ينبغي تفويت المقابلات الإضافية مع علماء الفلك. يسقط علماء الفلك المشاركون نصائح رائعة حول العلم ، والمجال كما هو ، بالإضافة إلى تاريخه الحديث.

لم يتم تضمين الإجابات على الاختبارات القصيرة بالكامل في مقاطع الفيديو. نتيجة لذلك ، كان علي إما أن أفكر مليًا في الإجابات أو البحث في المادة بشكل أكبر - كلا النشاطين جدير بالاهتمام.

يتم توفير مجموعات البيانات لمواصلة متابعة الموضوعات في الدورة ، وهو شيء أعتزم القيام به تمامًا. يتم تمرير خوارزمية k-d إلى وحدة AstroPy - أعتقد أنه يمكن إجراؤها من نقطة الصفر. & # 39

يتم إيلاء اهتمام دقيق لتفاصيل القضايا الإحصائية - مجموعات بيانات التدريب والاختبار ، والنظرية المقاربة لبيانات binning للحصول على متوسطات ، إلخ.

إذا كان لدي أي اقتراحات لتقديمها ، فسيكون ذلك لتشجيع كتابة نتائج التحليلات - إعطاء الطالب الفرصة ليس فقط للاحتفال بالكود الناجح ، ولكن لفهم النتائج أيضًا.

قبل خمسة وخمسين عامًا ، عندما كنت خريج مدرسة على وشك الذهاب إلى الجامعة لدراسة الفيزياء ، قمت بتشغيل التلفزيون في منتصف النهار - عندما لم يكن هناك أي شيء يظهر في جدول البرنامج المطبوع في أستراليا الغربية. لدهشتي ، بدلاً من & # 39 بطاقة اختبار & # 39 أو & # 39RF الضوضاء & # 39 ، كانت هناك محاضرة يلقيها أستاذ زائر من المملكة المتحدة ، كجزء من & # 39Sydney Summer School of Science & # 39 .

رائع! كان هنا تلفزيونًا تعليميًا تعليميًا مثيرًا ومفيدًا على قناة تلفزيونية تجارية أسترالية ، يتم عرضه في نفس الوقت كل يوم لأكثر من أسبوع ولكن بدون دعاية. قفز وعيي بالأسئلة الكبيرة في الفيزياء قفزة كبيرة إلى الأمام - عن طريق الصدفة.

تقدم سريعًا بعد 65 عامًا. ظهرت نظرة عابرة مؤخرًا على قائمة دورات الفيزياء في Coursera & # 39s مع & # 39Data Driven Astronomy & # 39 من جامعة سيدني. بعد أن أغلقت بسبب Covid-19 ، غامر في الأسبوع الأول من الدورة. يا لها من مفاجأة! لم أستطع التوقف عن متابعته - طوال اليوم ، كل يوم لعدة أيام متواصلة.

شكرًا لك ، جامعة سيدني ، على زيادة وعيي مرة أخرى حول الأسئلة الكبيرة الحالية في الفيزياء (علم الفلك) وكيف يمكن معالجتها بالبيانات الضخمة ومجموعة أدوات رائعة.

الدكتورة تارا مورفي جيدة بشكل استثنائي في استخراج وضغط المعلومات الأساسية ونقلها إلى الجمهور. دورة منظمة بشكل جيد للغاية مع أفلام قصيرة منتجة بشكل خيالي حول موضوعات علم الفلك الأساسية على مستوى تمهيدي (متعة كبيرة لمشاهدة هذا النوع المتعطش للقوة من الركلة المستديرة المجرية) تكشف عن بعض الأساسيات المهمة جدًا التي يجب أن تعرفها عن الحوسبة العلمية ، وتقدم لك بعضًا من المكتبات العلمية العامة المثيرة حقًا ، وفي النهاية ، تضيف تجربة تعليمية لمنصة GROK لا مثيل لها. هناك & # 39s واحد فقط downer (اثنان إذا أضفت قميص Dr Simon Murphy & # 39 s noctilucent في محاضرته الأولى): إنه يخدش فقط بضعة ميكرونات من ذلك التنين العلمي ذي الرأسين. لا تتوقع أن تكون قادرًا على حل المشكلات على نطاق العالم الحقيقي ، أي. الكون بالمعرفة المكتسبة. ومع ذلك ، عمل عظيم فريق علم الفلك القائم على البيانات!

تمثل الأسابيع القليلة الأولى تحديًا ، من وجهة نظر التشفير ، ولكن المعرفة التي يكتسبها المرء عن كوننا هي ببساطة رائعة. لم أستمتع أبدًا باستخدام لغة برمجة لحل المشكلات ، حتى وإن كانت على مستوى المبتدئين ، حتى هذه الفئة. رائع بكل بساطة. إذا كنت مهتمًا بالتعلم العميق ، مثلي ، وكنت طموحًا في مجال التعلم الآلي ، فأنا أقترح بشدة هذه الدورة إذا كنت تحاول أن تبدأ رحلتك في بايثون. أنا & # 39 م بارع في R.

لا أستطيع أن أصدق ذلك ، لكنني كنت دائمًا أحب الفيزياء الفلكية. بعد 6 سنوات من التعليم والحصول على درجة الماجستير في الهندسة الصناعية ، أعادت هذه الدورة إشعال حبي لدراسة عالمنا. سأكون جائعًا للمزيد وسأعود إلى المدرسة في المستقبل القريب أو البعيد للحصول على درجة علمية في الفيزياء الفلكية. شكرًا لك ، أنا أحب الفيزياء وأتمنى حقًا ألا أضيع وقتي في متابعة ما سعيت إليه.

دورة ممتازة توفر مقدمة في علم الفلك من وجهة نظر تحليل البيانات. مفاهيم علم الفلك التي تم تناولها في هذه الدورة ليست عميقة جدًا. ومع ذلك ، يتم اختيارهم جيدًا بحيث يمكن إجراء الدورة دون أي مشكلة. من ناحية أخرى ، تم شرح مفاهيم تحليل البيانات والتعلم الآلي جيدًا ، بحيث يكون ما تتعلمه هنا بمثابة أساس لمواجهة تحديات التعلم الجديدة. كما قلت ، فقط ممتاز!

لقد استمتعت بالدورة. شعرت أن هذه كانت دورة بيانات مع غلاف علم الفلك ، وهو أمر رائع ، لأن جزء البيانات قابل للتطبيق بطريقة تتجاوز علم الفلك. تقدم الدورة مقدمة جيدة عن numpy (مكتبة بايثون مفيدة للغاية) و sklearn (مكتبة تعلم آلي مفيدة للغاية). سوف آخذ هذه الدورة مرة أخرى.

هذه دورة رائعة تجمع بين موضوعات مثيرة للاهتمام في علم الفلك وتحديات بيثون المقابلة. يتم تناول كل من Numpy و SQL والتعلم الآلي هنا في سياق علم الفلك ، على الرغم من أنه من السهل رؤية كيف يمكن تطبيق نفس التقنيات في مجالات أخرى.

دورة ممتعة للغاية تقدم الكثير من التطبيقات العملية والأفكار في معالجة البيانات لعلم الفلك. يثير الاهتمام بإجراء مقابلات مع الخبراء ومواد إضافية حول الموضوعات الفلكية التي تمت دراستها.

هذه دورة رائعة لأي شخص يرغب في القيام بعلوم البيانات باستخدام مجموعات البيانات الفلكية. المحاضرات واضحة ومثيرة للاهتمام والأنشطة منظمة بشكل جيد. لقد استمتعت حقا بهذه الدورة!

واحدة من أفضل الدورات التي قمت بها على كورسيرا. يكفي علم الفلك لفهم المشكلات ، ثم انتقل إلى التدريبات خطوة بخطوة ، لبناء التعقيد. لا يمكن & # 39t التوقف!

أفضل MOOC I & # 39 على الإطلاق. عظيم لأي شخص مهتم بعلم الفلك و / أو التعلم الآلي.


قواعد البيانات الفلكية للتعلم الآلي؟ - الفلك

في الآونة الأخيرة ، شهد علم الفلك قفزة كبيرة وتطورات في أجهزة الكشف والأدوات والتلسكوبات وحتى المجسات التي يتم إرسالها إلى الفضاء الخارجي والكواكب البعيدة لجمع البيانات في مسوحات السماء لرسم خريطة لكوننا. يتم تنظيم هذه البيانات المجمعة في مجموعات بيانات كبيرة جدًا تشكل ما يسمى بعلم الفلك الموجه للبيانات. لسوء الحظ ، من المستحيل العمل على مجموعات البيانات الضخمة هذه يدويًا للحصول على نتائج فعالة ، لذلك يبحث علماء الفلك عن طرق لأتمتة عمليات المسح اليدوي التي يحملها الخطأ البشري من أجل اكتشاف المعرفة والمعلومات الفلكية من مجموعات البيانات الخام الكبيرة هذه من خلال أحدث التقنيات تقنيات التنقيب عن البيانات والأساليب الإحصائية وأدوات علم البيانات (هذا تخصص جديد يسمى المعلوماتية الفلكية). أعتقد ، مثل كثيرين آخرين ، أنه لا يوجد لاعب أفضل هنا من تطبيق خوارزميات وتقنيات التعلم الآلي على مجموعات بيانات فلكية ضخمة لتصنيف النجوم والكوازارات والمجرات إما باستخدام الصور الضوئية أو الانزياحات الحمراء أو مجموعات بيانات الإشارات التي يجمعها علم الفلك الراديوي. تاريخياً ، بدأت الجهود المبكرة في عام 2010 كمبادرات في المجلس القومي للبحوث (الولايات المتحدة). كانت هذه الخطوة هي الأساس الذي ركزت عليه المساهمات البحثية اللاحقة على المجال وإثرائه باستخدام مجموعة كبيرة موزعة في جميع أنحاء العالم من قواعد البيانات الفلكية الرقمية مثل تلسكوب المسح الشامل الكبير (LSST) ، ومرصد مصفوفة الكيلومتر المربع ، ومسح سلون الرقمي للسماء (SDSS). لكن هذا المجال لا يزال شابًا ويحتاج إلى مزيد من البحث للعثور على تقنيات دقيقة جديدة خاصة في التعلم الآلي والاستفادة على وجه التحديد من التعلم العميق وتوافر مجموعات البيانات الفلكية الضخمة المفتوحة الآن للجمهور. يجب حل مشاكل التصنيف هذه من أجل رسم خريطة لكوننا بشكل صحيح لاكتساب المزيد من الفهم حوله وتأييد النظريات الحالية والجديدة في علم الكونيات ، وبالطبع فإن التقنية المرشحة المثالية هنا هي التعلم العميق ، لأنها أثبتت نجاحها على مجموعات بيانات صور ضخمة مثل حالة مجالنا. من وجهة النظر هذه ، اخترت مشكلة تصنيف فلكي ملموسة للتحقيق في تطبيق خوارزمية التعلم العميق من أجل التحقق من صحة هذه الاحتمالية المذكورة باستخدام مجموعة البيانات العامة المعروفة لمسح Sloan Digital Sky Survey (SDSS) لاستطلاعات Supernova على وجه التحديد إرث SDSS المسح المسمى SDSS-II SN Survey.

توفر مسوحات السماء مجموعات بيانات فلكية ضخمة بأشكال مختلفة مثل الأطياف البصرية وأطياف الأشعة تحت الحمراء والانزياح الأحمر الضوئي ومنحنيات الضوء وبيانات التصوير التي تمثل مجموعة متنوعة من المعلومات والأجسام الفلكية. بالنظر إلى بيانات التصوير ، يبدأ علماء الفلك عملية التصنيف يدويًا عن طريق مسح الصور الموجودة في متناول اليد لاكتشاف ما هو حقيقي وما هو غير موجود ثم تجميعها في مجموعات من النجوم الممكنة ، والكوازارات ، والمجرات. غالبًا ما تحتوي بيانات التصوير على كائنات تظهر لفترة قصيرة من الوقت ، تسمى العابرين مثل أشعة جاما ، والكويكبات ، والمستعرات الأعظمية. المستعر الأعظم (SN) يحدث في نهاية عمر النجم ، أي عندما ينفجر نجم ما ، سوف يلمع بشدة في جميع أنحاء المجرة. يتم تصنيف المستعرات الأعظمية الناتجة (SNe) بناءً على ميزاتها الطيفية بأقصى ضوء إلى خمس فئات رئيسية (النوع الأول ، النوع الثاني ، النوع الأول ، النوع الأول ، النوع الأول) يختلف في وجود الهيدروجين والهيليوم وعناصر أخرى في أطيافها . انفجارات المستعرات الأعظمية هذه هي إما انفجارات نووية حرارية للأقزام البيضاء (للنجوم حول 1.4 كتلة شمسية وثنائيات أقطاب) أو انهيار لب النجم (نجوم ضخمة حوالي 9 كتلة شمسية) التي تطلق طاقة الجاذبية وتبقى كنجوم نيوترونية (نجوم نابضة) أو ثقوب سوداء. المشكلة هنا أن تصنيف المصنوعات والأشياء لهذه الظواهر الفيزيائية يتم يدويًا وهي مهمة تستغرق وقتًا طويلاً وهي أيضًا عرضة للتحيز البشري الذي يختلف من شخص لآخر ، كما أن المسح اليدوي غير ممكن بالنسبة لـ كمية هائلة من الصور. كحل لهذه المشكلة ، هناك جهود كبيرة لاستكشاف إمكانية تطبيق خوارزميات التعلم الآلي لأتمتة عملية اكتشاف المعرفة واستخراج المعلومات الفلكية ضمن مجموعات البيانات الخام الكبيرة هذه بدلاً من المعالجة اليدوية والبشرية غير القابلة للتطبيق. في مشروعنا ، قمنا بالتحقيق في تطبيق خوارزمية التعلم العميق من أجل التحقق من صحة هذا الاحتمال المذكور ولكن لغرض المقارنة مع نموذجنا المعياري ، اخترت الخطوة الأولى لعلماء الفلك والتي تبحث عن أشياء مثيرة للاهتمام في مشكلة تصنيف ثنائي لتحديد ما هو حقيقي وما هو غير موجود في بيانات التصوير الأساسية.

الخوارزميات والتقنيات

من أجل تقليل التحيز البشري اعتمادًا على الحالة المزاجية والتعب لمن يقوم بإجراء المسح اليدوي ، يتم حقن مجموعات بيانات SDSS بشكل عشوائي مع قدر من صور الكائنات المزيفة بين الصور الأصلية. الجزء المتبقي من المشكلة هو عدم جدوى تصنيف مئات وآلاف الصور في الليلة بواسطة الإنسان ، لذا يجب استبدالها بالآلات وهذا ما أحاول التحقق منه في مشروعي. سوف أقوم بإنشاء شبكة عصبية تلافيفية لأتمتة العملية اليدوية لتصنيف بيانات التصوير العابر من مسح SDSS Supernova إلى كائنات حقيقية ومصنوعات يدوية لأن هذه الخوارزمية توفر نتائج رائعة للتعرف على الصور. يتم إنشاء صور الفرق عن طريق طرح صورة مرجعية من أحدث صورة لجزء معين من السماء ، وهذا سيترك صورة ضوضاء خالصة ما لم تكن هناك صورة عابرة. لتبسيط مشكلتنا ، سأحولها إلى مهمة تصنيف ثنائي ، أي أن المهمة ستكون اكتشاف العابرين الحقيقيين من غير الواقعيين

ركزت معظم الأعمال المماثلة لهذا المشروع على العمل المسبق لمصنع SN (Roman و Aragon & amp Ding في 2006 و Bailey 2007) باستخدام خوارزميات التعلم الكلاسيكية الخاضعة للإشراف لإنجاز مهمة التصنيف التلقائي. كنموذج معياري لعملي ، سأقترح المنشور المعنون "تصنيف التعلم الآلي لصور مسح SDSS العابر". يعمل هذا البحث على نفس مجموعة البيانات ، ولكنه يستخدم خوارزميات تعليمية مختلفة مثل Random Forest ، و k- الأقرب جيران ، و Naïve Bayes ، وآلة متجه الدعم (SVM). ثم يقارن أداءهم باستخدام نفس المقاييس التي استخدمتها ، وبعبارة أخرى لقد قمت بإعادة صياغة هذا البحث ولكن باستخدام شبكات التعلم العميق التلافيفية ثم مقارنة عملي بالعمل السابق. ولكن على النقيض من ذلك ، فإنهم يعتمدون على خوارزمية تحليل المكونات الرئيسية (PCA) لاستخراج ميزات مثل السمات مثل الشكل والموضع والحد الأقصى للعرض الكامل (FWHM) والمسافة إلى أقرب كائن في صورة الاختلاف بالإضافة إلى مرشحات كاميرا SDSS (g ، r، i، z، u) ، في حلنا ، ليست هناك حاجة لمعالجة استخراج الميزات باستخدام PCA ولكن CNN الخاص بنا سيتعلمها. حقق النموذج المعياري النتائج التالية التي أقوم بمقارنة نتائجي بها.

النموذج المعياري الذي نقارنه هو فحص مجموعة متنوعة من خوارزميات التعلم الآلي من أجل التصنيف العابر وقد تم تبسيطه لأداء العملية الأولية للتصنيف الثنائي للكائنات في بيانات التصوير الفلكي إلى كائنات حقيقية وغير حقيقية. من نتائج علامة المقعد ، نلاحظ أن أفضل مصنف تم استخدامه هو Random Forest (RF) بدقة واستدعاء بنسبة 91 ٪. بالإضافة إلى أنها تستخدم شبكة عصبية تسمى SkyNet تعطي دقة 88٪ واسترجاع 89٪. لكن نتيجتنا النهائية باستخدام شبكة التعلم العميق التلافيفية (CNN) تعطي دقة مقبولة جيدة بنسبة 92.36٪ وتذكر 96.51٪ ، لقد حاولت الحصول على الحل الأمثل للمشكلة وإظهار أن استخدام خوارزميات التعلم الآلي خاصة التعلم العميق يمكن أن يتجاوز المسح اليدوي البشري العملية وأعتقد أنني وصلت إلى هذا الهدف بدرجة ما.


شاهد الفيديو: علم البيانات والتعلم الآلي - مقدمة: من أنا لماذا ولمن علم البيانات (شهر اكتوبر 2021).