الفلك

كيف أبدأ في تحليل بيانات علم الفلك؟

كيف أبدأ في تحليل بيانات علم الفلك؟


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

أنا أتعلم بعض التعلم الآلي (لدي خلفية سابقة في الإحصاء) بمفردي ، وأنا مهتم بالحصول على بعض التدريب العملي من خلال إجراء بعض تحليل ML في R و Python.

نظرًا لمدى جنوني تجاه علم الفلك ، أود أن أتسخ يدي في القيام ببعض ML باستخدام البيانات المفتوحة. إنني أدرك أن منظمات مثل ناسا لديها الكثير من مجموعات البيانات المفتوحة. ما أنا أقل وضوحًا بشأنه هو نوع التحليل الذي يجب القيام به.

لذا ، أود أن أعرف ما إذا كان هناك أي موقع ويب يمكنني من خلاله الحصول على مستودع لبيانات الفضاء (الصور ، الإشارات ، أو أي شيء آخر) والذي يسأل عن التحليل المطلوب ؛ نوع من مثل Kaggle حيث يحصل المرء على مجموعة البيانات ولديه السؤال المطلوب الذي يمكن للمرء أن يحاول.


قد تكون الاحتمالية عبارة عن دورة دراسية في جامعة أو موقع youtube أو دورة دراسية ذاتية عبر كتاب.

ما استخدمناه في فصل الإحصاء الفلكي لدينا هو "Wall & Jenkins: إحصائيات عملية لعلماء الفلك" والذي يقدم أقسامًا نظرية مع تمارين كمتابعة. لا توجد أقسام للإجابة ، حيث تحتاج إلى القيام ببعض البرمجة لبعضها.

ولكن يمكنك إعارة هذا الكتاب أو الكتب المماثلة في مكتبة جامعة محلية ، دون الحاجة إلى إنفاق المال.


قد تكون وحدة Python AstroML مثيرة للاهتمام بالنسبة لك. يكون مصحوبًا بكتاب مدرسي حول التعلم الآلي المطبق على مجموعات البيانات الفلكية ، ولكن إذا لم يكن لديك المال لتنفقه على الكتاب ، فهناك بعض التمارين ومجموعات البيانات المضمنة في الوحدة نفسها والتي من المفترض أن تمنحك الكثير لتتعمق فيه.


هنا مصدر جيد للبيانات العامة https://pds-imaging.jpl.nasa.gov/. أخشى أنه بدون بعض الدورات التدريبية الأساسية في علم الفلك ، سيكون هناك الكثير من المتاعب الصغيرة (على سبيل المثال ، الإحداثيات المعبر عنها في الإحداثيات الكروية وما إلى ذلك ، وقد تتوقع قارئ تنسيق xyz. FITS) لأي شخص جديد. كن مستعدًا عقليًا للعديد من العقبات الصغيرة.


الدعم

من وقت لآخر ، أود أن أذكر بعض الكتب التي وجدتها قيّمة في بحثي الخاص. لكن أولاً ، يجب أن أعتذر عن مصطلح "الأبحاث الفلكية للهواة". الحقيقة هي ، إذا كنت تساهم ببيانات قيمة وربما تنشر بحثًا (حتى لو كان مع مجموعة من المؤلفين) ، فأنت لم تعد "هاوًا" بالمعنى المعتاد: فأنت "باحث فلكي ممول ذاتيًا". قد لا يكون لديك شهادة في علم الفلك ، ولكن فقط تذكر أن داروين حصل على درجة علمية في اللاهوت ، وليس علم الأحياء ، وكان نيوتن حاصل على درجة الماجستير والدكتوراه. كما نعرفه اليوم في العلوم هو اختراع ألماني من القرن التاسع عشر. كونك عالمًا لا يتعلق بالدرجات ، بل يتعلق بجمع البيانات وإما تحليل تلك البيانات والاطلاع عليها حتى النشر ، أو الإعلان عن الاكتشافات والتحقق منها ، أو إتاحة هذه البيانات للعلماء الآخرين.

حسنًا ، تريد أن تمارس بعض العلوم ، فمن أين تبدأ؟

ربما يكون أفضل مكان في البداية هو كتاب روبرت بوشيم ، السماء هي مختبرك. في 293 صفحة ، يغطي Buchheim تقريبًا كل مجال من مجالات البحث الفلكي التي تقع في متناول عالم الفلك المموّل ذاتيًا. يحظى مراقبو GRAS بأهمية خاصة في مجال جمع البيانات وتحليلها (الفصلان 4 و 5) وهما المشروع H ، والقياس الضوئي CCD للنجوم المتغيرة ، والمشروع الأول ، وتحديد منحنيات ضوء الكويكب ، والمشروع J ، وعبور الكوكب خارج الطاقة الشمسية ، والمشروع L ، والكويكب قياس الفلك (المذنبات أيضًا!). بطبيعة الحال ، المفضل لدي هو Project M ، وهو قياس النجوم المرئية المزدوجة.

يهتم الكثير من مراقبي iTelescope.Net بالاكتشاف. تمت تغطية هذا في الفصل 6 حيث يغطي المشروع O اكتشاف الكويكبات ، ويتعامل المشروع P مع اكتشاف المذنبات وعمليات البحث عن المستعرات المستعربة والمستعرات الفائقة Q و R.

على طول الطريقة التي يناقش بها Buchheim أساسيات القياس الضوئي (بعض من أفضل التفسيرات التي قرأتها) ، خطأ القياس (مهم بشكل أساسي ، القياسات الخالية من الأخطاء مفيدة مثل تلك التي تحتوي على أخطاء) ، كيفية التفاعل مع وكالات مثل Minor Planet Center ، الوقت والكتالوجات واستخراج البيانات والأدب ومجموعة من الموضوعات المهمة الأخرى.


عالم فلك لعالم بيانات

لقد قمت مؤخرًا بالانتقال من باحث في الفيزياء الفلكية إلى عالم بيانات لشركة تقنية (Yammer / Microsoft). فيما يلي اقتراحات للأشخاص في الأوساط الأكاديمية / البحثية المهتمين بمتابعة وظيفة تقنية.

تهتم معظم شركات التكنولوجيا بالأشخاص الأذكياء والموهوبين الذين يمكنهم التعلم بسرعة ولديهم مهارات جيدة في حل المشكلات. العلماء لديهم هذه الصفات. لذلك إذا تقدمت بطلب للحصول على وظائف في شركات التكنولوجيا ، فمن المحتمل أن تحصل على الأقل على رد من المجند. ومع ذلك ، بمجرد إجراء مقابلة ، هناك العديد من المهارات الأخرى التي ستحاول الشركة تقييمها ، وهي مهارات قد تكون لديك أو لا تمتلكها بالفعل.

فيما يلي بعض النصائح التي ستساعدك في عملية التقديم / المقابلة ، وكذلك في الوظيفة في شركة تكنولوجيا.

آسف علماء الفلك ، ولكن IDL لن يقطعها إذا كنت ترغب في الحصول على وظيفة تقنية. أنت بحاجة إلى تعلم إحدى لغات البرمجة المتوافقة مع معايير الصناعة. تعتبر Python و Ruby و Java و Perl و C ++ لغات جيدة للتجميع. سيكون من الجيد أيضًا تعلم حزمة تحليل إحصائي مثل R أو SAS أو SPSS أو Excel ، بالإضافة إلى حزمة التصور لإظهار نتائجك. تتضمن بعض الوظائف مقابلة ترميز. هذه تتطلب بعض المعرفة بخوارزميات علوم الكمبيوتر. ابحث على الإنترنت ، فهناك العديد من أمثلة مشكلات الترميز التي يمكنك ممارستها.

2) تعرف على قواعد البيانات

"البيانات الضخمة" هي الويب 2.0 كلمة. إذا كنت ترغب في اللعب بالبيانات الضخمة ، فستحتاج إلى تعلم كيفية إدارتها والتعامل معها والوصول إليها. SQL أمر لا بد منه. سيكون من الرائع أن تتمكن أيضًا من التعرف على Hadoop / MapReduce و Hive.

تتضمن العديد من المقابلات التقنية إجراء رياضيات معقدة ، واحتمالات ، وإحصاءات ، ومضايقات ذهنية ، ومشكلات مفتوحة النهاية. تخلص من بعض كتب الإحصاءات القديمة أو اختر كتابًا عن تحليل البيانات باستخدام إحدى اللغات المذكورة أعلاه. ابحث عبر الإنترنت عن أسئلة المقابلة السابقة للشركات التي تتقدم إليها.

4) الاتصال هو المفتاح

لكي تكون فعالًا في وظيفة تقنية ، لا يجب أن تكون قادرًا على البرمجة وتحليل البيانات وحل المشكلات فحسب - بل تحتاج إلى شرح عملك بسهولة للأشخاص غير التقنيين للغاية. يعد التواصل أمرًا مهمًا للغاية بالنسبة لهذه الأدوار ، ويتمثل جزء كبير من عملية المقابلة في قياس مدى جودة شرح الأفكار المعقدة لشخص عادي. هناك العديد من الفرص لممارسة هذه المهارة داخل الأوساط الأكاديمية ، لذا قم بإلقاء العديد من المحادثات أو تدريس الفصول الدراسية أو المعلم أو التطوع أو القيام بكل ما في وسعك لتصبح مرتاحًا جدًا لشرح الأفكار التقنية للأشخاص ذوي الخلفيات ومستويات المهارة المختلفة

5) تحويل سيرتك الذاتية إلى سيرة ذاتية

هناك فرق ، وهو مهم. يحصل الأشخاص في شركات التكنولوجيا على مئات من السير الذاتية. من المهم أن تسلط الضوء بإيجاز على المهارات التي تجلبها إلى كل وظيفة. إنه لأمر رائع أنك نشرت عشرات الأوراق ، وألقيت الكثير من المحاضرات ، وعلمت العديد من الفصول. ولكن الأهم من ذلك هو مهارات التي اكتسبتها من تلك التجارب. يجب أن تكون السيرة الذاتية من صفحتين إلى صفحتين فقط. انظر إلى المهارات المطلوبة للوظيفة التي تتقدم لها ، ثم حاول إظهار تلك المهارات من خلال سرد الخبرة ذات الصلة.

6) الأكاديمي مقابل مشاكل الأعمال

في الأوساط الأكاديمية ، يكون الهدف عادةً هو الحصول على أدق حل ممكن. الوقت والكفاءة أقل أهمية من القيام بشيء دقيق وصارم. الهدف في مجال الأعمال هو زيادة قيمة شركتك. لذلك يجب أن تعمل أي مهمة على تحسين الدقة والقيمة. هذا تحول صعب على العديد من الأكاديميين القيام به. اقض بعض الوقت في قراءة TechCrunch ومواقع أخرى من هذا القبيل للمساعدة في التعرف على المقاييس والمشكلات المختلفة التي تهتم بها شركات التكنولوجيا. كن مستعدًا للعمل في مواعيد نهائية قصيرة ولتكون قادرًا على ترتيب أولويات المهام من أجل زيادة قيمة عملك. ضع ذلك في الاعتبار عند الإجابة على أسئلة المقابلة المفتوحة بحيث تظهر فهمك لهذا الاختلاف.

7) قم بإجراء تدريب أو مشروع

أفضل طريقة لوضع قدمك في باب شركة تكنولوجيا هي القيام بفترة تدريب. لقد دفعت العديد من شركات التكنولوجيا الكبرى دورات تدريبية صيفية ستعرفك على هذا النوع من العمل ، بالإضافة إلى تعليمك العديد من المهارات المذكورة أعلاه. زمالة Insight Data Science عبارة عن تدريب داخلي مصمم خصيصًا لمساعدة الأكاديميين على الانتقال إلى مناصب تقنية. إذا كنت غير قادر على أخذ إجازة من وظيفتك الحالية ، ففكر في القيام بمشروع بنفسك. أنشئ تطبيقًا لهاتفك ، أو قم بمشروع بحثي باستخدام أحد مصادر البيانات المجانية العديدة المتوفرة. سيعطيك هذا نظرة ثاقبة للعمل الذي قد تقوم به في شركة تكنولوجيا ، ومجموعة مهمة من نقاط الحديث للمقابلات.

إذا كان لديك المزيد من الأسئلة حول الانتقال من الأوساط الأكاديمية إلى التقنية أو عملية المقابلة التقنية ، فلا تتردد في الاتصال بي.


AY 155: الحياة في الكون

المتطلبات المسبقة: لا أحد
دراسات عامة: علم الطبيعة
الساعات المعتمدة: 3

الملف الشخصي للدورة: "الحياة في الكون" هي دراسة استقصائية للعلوم متعددة التخصصات الجديدة والسريعة التطور في علم الأحياء الفلكي للتخصصات غير العلمية. يجلب هذا العلم أدوات علم الفلك والأحياء ، وكذلك الجيولوجيا والكيمياء ، لمحاولة الإجابة على أسئلة مثل: كيف بدأت الحياة على الأرض؟ هل بدأت الحياة في مكان آخر في مجرتنا؟ إذا كانت هناك حياة على كواكب أخرى ، فكيف نتعرف عليها؟

سيتم تعريف الطلاب الذين يأخذون هذه الدورة بعلم الأحياء الفلكية ، وعملية العلوم ، والتفكير العلمي ، وأساسيات المبادئ الفلكية والفيزيائية المستخدمة خلال هذه الدورة. ثم يستكشف الطلاب حالة معرفتنا الحالية وطبيعة الحياة على الأرض ، وجيولوجيا الأرض لأنها تجعل كوكبنا صالحًا للسكنى ، وأصل الحياة على الأرض ، وعملية التطور. سنقوم بعد ذلك بتطبيق هذه المعرفة على مسألة ما إذا كانت الحياة موجودة حاليًا ، أو كان من الممكن أن تكون موجودة في الماضي ، على أجسام أخرى في نظامنا الشمسي بما في ذلك الكواكب الزهرة والمريخ ، والأقمار الكبيرة لكواكب المشتري وزحل ونبتون. سنقوم بعد ذلك بالتحقيق في تأثير تاريخ نظامنا الشمسي على قابلية الحياة للعديد من الكواكب والأقمار. يركز القسم الأخير من الدورة التدريبية على إمكانيات الحياة على الكواكب التي تدور حول نجوم أخرى في مجرتنا (وخارجها) من خلال تلخيص ما هو معروف ومتوقع من استطلاعات الكواكب التي تدور حول نجوم أخرى ، والبحث عن ذكاء خارج الأرض ، وآفاق السفر بين النجوم في المستقبل.

ستعرضك هذه الدورة التدريبية على الإثارة في مجال علم الأحياء الفلكي الجديد بهدف تركك مع اهتمام مدى الحياة بعلم الفلك والبيولوجيا والجيولوجيا والكيمياء (خاصةً لأنها تنطبق على الأسئلة المركزية لهذه الدورة) وتقديرًا لـ كل العلم. لا يلزم معرفة هذه العلوم كشرط أساسي. نظرًا لأن العلماء بدأوا للتو العديد من الدراسات في علم الأحياء الفلكي ، فإن الاكتشافات الجديدة تُجرى باستمرار. سيصف هذا المقرر الدراسي كيف تغيرت نظرتنا للحياة على الأرض وفي أي مكان آخر في الكون بمرور الوقت وتغطي الاكتشافات الجديدة عند حدوثها.

صيغة: من المتوقع أن يخصص الطلاب ما يقرب من 2 إلى 3 ساعات لكل ساعة معتمدة لكل أسبوع من وقت التحضير خارج اجتماعات الفصل. الوقت المطلوب لهذه الدورة هو 6 إلى 9 ساعات في الأسبوع. ستقضي هذا الوقت مع القراءة المخصصة والخارجية ، والواجب المنزلي ، ومناقشة مادة الدورة مع الآخرين (سواء كانوا مسجلين في هذا الفصل أم لا) ، والدراسة ، والتفكير في قراءتك وتجربتك مع الموضوعات التي تمت مناقشتها في الفصل. هذا ما يسمى & # 8220 وقت التفكير & # 8221 هو عنصر أساسي في هذه الدورة. سيتوفر مقال مفيد حول الاقتراحات الموصى بها بشدة حول كيفية قضاء هذا الوقت بعنوان & # 8220 كيف تنجح في الفيزياء عن طريق المحاولة الحقيقية & # 8221 على صفحة BlackBoard لهذه الدورة.


AstroImageJ: أداة بسيطة وفعالة لتحليل الصور الفلكية والقياس الضوئي الدقيق

لذلك ذهبت للمراقبة ، وحصلت على سلسلة زمنية من الصور لقياس ضوئي دقيق وتريد رسم منحنى ضوئي. ماذا الآن؟ تحتاج إلى تقليل البيانات. من أين تبدأ؟ هنا ، مع AstroImageJ (AIJ).

رسم بياني 1. عرض الصورة AIJ. الشكل 2 من الورقة.

هذا Astrobite هو كتاب تمهيدي لـ AIJ: سأقدم AIJ وأذكر بعض الأشياء التي يمكن أن تفعلها AIJ ، مع التركيز على قدراتها القوية للقياس الضوئي التفاضلي الدقيق ، وأعطيك بعض الروابط المفيدة حول مكان البحث عن مزيد من المعلومات. دعونا نتعمق في الأمر.

ما هو AstroImageJ؟ ماذا يمكن أن تفعل؟

AIJ هو برنامج تحليل صور تفاعلي سهل الاستخدام. تم بناء AIJ على ImageJ ، والذي يستخدم على نطاق واسع في مجال علم الأحياء والمعلوماتية الحيوية. لقد أضافت الطبعة "الفلكية" من ImageJ إليها العديد من إمكانيات الحد من البيانات الخاصة بعلم الفلك ، والتحليل ، والنمذجة ، والتخطيط.

تم تصميم AIJ على Java ، ويعمل بسهولة على منصات متعددة (على سبيل المثال ، أجهزة Mac و Windows و Linux). تقوم AIJ بكل ما يفعله عارض وقارئ قياسي من نوع FITS ، وتعمل أيضًا مع تنسيقات الصور القياسية الأخرى (JPG ، PNG ، TIFF ، إلخ). يشبه AIJ من نواح كثيرة DS9 ، وهو مألوف لدى العديد من علماء الفلك (إذا لم تكن قد سمعت عن DS9 ، تحقق من Astrobite التمهيدي لـ Nathan هنا).

يتم سرد عدد قليل من القدرات العديدة ذات الصلة بعلم الفلك AIJ أدناه:

  • معايرة الصورة: يمكن أن تنشئ AIJ إطارات رئيسية مسطحة ومظلمة ومتحيزة.
  • حساب الصورة بما في ذلك طرح الصورة ، الجمع ، القسمة ، الضرب ، إلخ.
  • تحرير المكدس ، لإجراء العمليات بسهولة على سلسلة من الصور.
  • ميزات تثبيت الصورة ومحاذاة الصورة.
  • محولات تنسيق دقيقة ، لحساب تواريخ جوليان هيليوسنتريك وباري سنتر.
  • إحداثيات WCS: يمكن AIJ حل الصور باستخدام Astronomy.net
  • دعم الماكرو والمكونات الإضافية: اكتب وحدات الماكرو الخاصة بك!
  • قياس ضوئي متعدد الفتحات مع تركيب منحنى ضوء تفاعلي: انظر المناقشة أدناه.

القياس الضوئي التفاضلي - ورسم منحنيات الضوء في الوقت الحقيقي

الصورة 2: فتحة برمجية في AIJ ، تتمحور حول نجمة ، مع حلقة لتقدير عدد خلفية السماء.

توفر AIJ واجهة تفاعلية سهلة الاستخدام - تسمى "معالج البيانات" - لتنفيذها فتحة قياس الضوء التفاضلي ، وهي تقنية شائعة الاستخدام لقياس التغيير في التدفق من نجم ، وتقنية مستخدمة لتوصيف الكواكب الخارجية عبر طريقة العبور. تدفق موضوع اهتمامك - أي من "نجمك المستهدف" —يمثله صافي الأعداد المتكاملة التي تقع ضمن فتحة برنامج يحددها المستخدم (انظر الشكل 2). يتم حساب العدد الصافي من خلال جمع جميع قيم البكسل داخل الفتحة بعد طرح تقدير لتدفق السماء في الخلفية ، المقدّر من حلقة متمركزة حول الفتحة (الشكل 2). يأتي الجزء "التفاضلي" من حقيقة أنك تقارن تدفق "الهدف" الخاص بك بـ "نجم مرجعي" قريب تمت ملاحظته في نفس الوقت (أو مجموعة من النجوم المرجعية) ، وهو مفيد بشكل خاص لتصحيح الاختلافات في الغلاف الجوي (ربما سحابة تتدحرج؟) إذا كنت تراقب من الأرض.

تين. 3: (يسار) مثال على إمكانيات رسم منحنى الضوء AIJ & # 8217s. (يمين) لوحة تركيب النقل AIJ. الشكلان 7 و 8 من الورقة على التوالي.

تتيح لك وحدة معالج البيانات من AIJ تحديد فتحات برامجك ، والتنقل تلقائيًا عبر سلسلة زمنية من الصور لتجميع ورسم منحنيات الضوء لنجمك المستهدف (انظر الشكل 3 ، على اليسار للحصول على مثال). توفر AIJ خيارًا للقيام بذلك في الوقت الفعلي ، والتخطيط في نقطة بيانات جديدة بمجرد حفظ صورة جديدة في التسلسل الخاص بك - وهي مفيدة للغاية للتحليل السريع والتحقق من صحة بياناتك عند التلسكوب! إذا كنت تبحث عن كواكب عبر طريقة العبور ، فإن AIJ تقدم أيضًا أداة تركيب تفاعلية لتلائم وتعطيل عبورك (الشكل 3 ، على اليمين).

مزيد من مواد القراءة

لقد خدش هذا النجم النجمي سطح ما يمكن أن تفعله AIJ. من خلال واجهة سهلة الاستخدام ، تعد AIJ جيدة بشكل خاص لبدء أي شخص في القيام بتقليل صورة علم الفلك بدرجة بحثية - لا سيما لإجراء قياس ضوئي تفاضلي دقيق. من الناحية الشخصية ، وجدت أن AIJ بديهيًا للغاية ، وجعلتني أبدأ في إجراء قياس ضوئي تفاضلي متعدد الفتحات وتركيب منحنى الضوء في أي وقت من الأوقات. لذا ، بكل الوسائل ، اذهب وتحقق من ذلك ، وابدأ في إجراء بعض القياسات الضوئية في الوقت الفعلي. أدناه ، اتبع بعض الروابط مع المزيد من مواد القراءة:


وظائف بديلة: الاستفادة من درجة علم الفلك لعلوم البيانات

إلى جانب الانفجار الأخير لـ & # 8220Big Data & # 8221 في الوعي العام ، كان هناك انتقال مماثل إلى عصر & # 8220Big Astronomy & # 8220. لطالما كان علماء الفلك بارعين في استخلاص النتائج باستخدام الإحصائيات المتقدمة وتحليل البيانات. الآن ، مع ظهور عمليات محاكاة كبيرة للغاية مثل Illustris واستطلاعات مثل LSST القادمة ، يكتسب علماء الفلك خبرة متزايدة في التعامل مع مجموعات بيانات أكبر بكثير مما يمكن أن يأمل في وضعه على جهاز كمبيوتر واحد.

مع وجود هذه المهارات في متناول اليد ، يبحث العديد من العلماء الحاصلين على درجات علمية في علم الفلك عن (ويجدون) وظائف ناجحة جدًا في علم البيانات والتحليلات. في أبريل 2016 ، استضافت مكتبة Wolbach في مركز Harvard-Smithsonian للفيزياء الفلكية حلقة نقاش ضمت العديد من علماء الفلك السابقين الذين استفادوا من شهاداتهم منذ ذلك الحين للعثور على وظائف في علم البيانات. حظيت لجنة & # 8220Alternative Careers & # 8221 بحضور جيد للغاية ، وكنت واحدًا من بضع عشرات من الطلاب وباحثي ما بعد الدكتوراة وحتى أعضاء هيئة التدريس الذين توقفوا عندنا. فيما يلي ملخص للوحة ، والأفكار التي طرحها هؤلاء أعضاء اللجنة لعلماء الفلك المهتمين بالنظر في وظائف خارج الأوساط الأكاديمية.

المتحدثون

ناثان ساندرز حصل على درجة الدكتوراه في علم الفلك والفيزياء الفلكية من جامعة هارفارد في عام 2014 ، وهو الآن المدير الأول للتحليلات الكمية في Legendary Entertainment ، استوديو هوليوود الذي أنتج ثلاثية Dark Knight ، Inception ، والفيلم القادم Warcraft. ناثان هو أيضًا أحد مؤسسي Astrobites.

كاميرون ماكبرايد حصل على درجة الدكتوراه من جامعة بيتسبرغ ، تلاه مناصب ما بعد الدكتوراه في فاندربيلت وجامعة هارفارد سميثسونيان CfA. وهو الآن كبير علماء البيانات في True Fit ، وهي شركة ناشئة تقدم تحليلات البيانات لصناعة الأزياء.

نادية بريمر حصلت على درجة الماجستير في علم الفلك من جامعة لايدن قبل أن تعمل كمحلل بيانات في شركة Deloitte Consulting. بعد أن اكتشفت أن شغفها كان في تصور البيانات ، بدأت العمل في Adyen كمصمم تصور بيانات ، واستضافت مدونتها الخاصة بالبيانات ، VisualCinnamon.

انضم ثلاثة علماء بيانات حاصلين على درجات علمية في علم الفلك إلى لوحة الوظائف البديلة. (يسار) ناثان ساندرز من الترفيه الأسطوري و Astrobites. (في الوسط) كاميرون ماكبرايد من True Fit. (يمين) نادية بريمر من أدين.

لماذا يريد علماء الفلك وظائف في علم البيانات؟

كان الموضوع الذي نوقش كثيرًا هو سبب بحث علماء الفلك عن وظائف في علوم البيانات. يهتم العديد من علماء الفلك بوظائف خارج الأوساط الأكاديمية بسبب مدى تنافسية سوق عمل أعضاء هيئة التدريس ، وبسبب الصعوبة المتزايدة في الحصول على التمويل من خلال المنح البحثية.

ومع ذلك ، عندما سُئلوا عن سبب قرارهم الدخول في مهنة غير أكاديمية ، لم يقل أي من أعضاء اللجنة أن السبب الأساسي كان نقديًا أو بسبب سوق العمل الصعب في علم الفلك.

شدد ماكبرايد على مدى استمتاعه ببيئة العمل منخفضة الضغط في شركة ناشئة. قالت بريمر إنها استمتعت بفرصة تقديم نتائج بحث جديد بسرعة ، دون الحاجة إلى الخوض في عملية كتابة الأوراق. ذكر الثلاثة أن الانتقال إلى علم البيانات أتاح لهم مواجهة تحديات جديدة باستخدام أدوات لم يجربها أحد من قبل. أضاف ساندرز أن هذا يوفر فرصة لإحداث تأثير كبير حقًا داخل الشركة أو الصناعة.

لماذا تريد شركات علوم البيانات علماء الفلك؟

ألقى أعضاء اللجنة الضوء أيضًا على الجانب الآخر من المعادلة: لماذا ينجح علماء الفلك في الحصول على وظائف علوم البيانات هذه. كما هو مذكور في مقدمة هذه المقالة ، يتم تدريب علماء الفلك اليوم بشكل روتيني للتعامل مع & # 8220big البيانات & # 8221. لكن لدى علماء الفلك مهارات إضافية يصعب تعزيزها في مجالات أخرى تتعامل أيضًا مع مجموعات بيانات كبيرة جدًا.

وفقًا لساندرز ، تتمثل إحدى المزايا الرئيسية للتدريب كعالم فلك في مدى استقلالية بحث أطروحة الدكتوراه. بينما يعمل بعض علماء الفلك في تعاون كبير جدًا ، فمن الشائع جدًا أيضًا أن يعملوا بشكل فردي في مشروع صغير مع مستشارهم. يمنحهم هذا خبرة في رؤية المشروع من البداية إلى النهاية ، وكذلك في كيفية تصميم تجربة جيدة.

أضاف ماكبرايد أن علماء الفلك يميلون إلى أن يكونوا أقل تخصصًا من العلماء في المجالات الأخرى ، مما يسمح لهم بتعلم مجموعة متنوعة من المهارات المفيدة. على سبيل المثال ، من الشائع جدًا أن يتمتع علماء الفلك بخبرة كبيرة في البرمجة ، وحتى تطوير خطوط أنابيب التحليل الخاصة بهم. على حد تعبيره ، & # 8220 نصنع أدواتنا الخاصة عندما نحتاج إلى واحدة أفضل & # 8221.

ماذا تفتقد من علم الفلك / الأوساط الأكاديمية؟

عند سؤالهما عن العناصر الأكاديمية التي فاتهما ، ذكر كل من بريمر وماكبرايد أنهما يفوتان أحيانًا إجراء & # 8220 بحثًا أساسيًا & # 8221 في موضوعات ذات تأثير أكبر على العلوم. قال ماكبرايد أيضًا إنه يفتقد فرصة التفاعل مع الطلاب ومناصرة العلوم والتدريس. ناقش ساندرز الأطر الزمنية المنخفضة للمشروع ، وغالبًا ما كان لديه بضعة أيام أو أسابيع فقط للعمل على جزء كبير من المشروع قبل الاضطرار إلى الانتقال إلى آخر & # 8220crisis & # 8221.

وجدت بريمر أن سير العمل الاستشاري حصرها أيضًا في المواعيد النهائية الثابتة والمشاريع المتغيرة بشكل متكرر ، لكن هذه كانت مزايا لها ، حيث أتيحت لها الفرصة للتكيف باستمرار مع مجموعات البيانات الجديدة ولغات البرمجة الجديدة. في غضون ذلك ، ذكر ماكبرايد أن العمل في شركة ناشئة أتاح له مزيدًا من الحرية لاستكشاف أفكاره الجديدة.

تم منح ساندرز ، الذي تم إحضاره في وقت مبكر من عمر قسم ضمان الجودة الأسطوري & # 8217 ، الفرصة لاستيراد بعض جوانب العملية الأكاديمية إلى الصناعة. قدم نوادي المجلات والاجتماعات الجماعية ، مما ساعد على تعزيز تبادل الأفكار بين الأشخاص العاملين في مشاريع مختلفة.

كيف يمكنني متابعة وظيفة في علم البيانات؟

يبدو من الواضح أن علماء الفلك سيستمرون في التأثير بشكل كبير على الصناعة المتنامية لعلوم البيانات. بالنسبة لأولئك الأكاديميين الذين يفكرون في وظائف خارج المجال ، توصي McBride بمتابعة بعض موضوعات علوم البيانات بشكل أعمق قليلاً. جرب المشاريع الصغيرة (حتى المشاريع الجانبية خارج علم الفلك) للمساعدة في زيادة ثقتك بلغات أو أدوات أو تقنيات إحصائية معينة. ومع ذلك ، لا تحتاج إلى أن تكون خبيرًا عالميًا في التعلم الآلي للحصول على وظيفة. كما يقول ساندرز ، & # 8220 الشركات تبحث عن عاملين & # 8221 ، الأشخاص الذين يظهرون أن بإمكانهم استخدام الأدوات الحالية والعثور على استخدامات جديدة لها. وأضاف أن & # 8220 لا يوجد شيء اسمه فكرة أصلية & # 8221 ، وأن تعريض نفسك لأفكار من تخصصات أخرى أمر ضروري.

شدد أعضاء اللجنة على مدى فائدة الشبكات في العثور على وظائف في الصناعة. ذهب بريمر إلى أيام داخلية ومعارض شبكات ، وظلل على الناس في مختلف الصناعات قبل اختيار الاستشارات ، بينما أقام ساندرز علاقات تعاون مع الطلاب في أقسام الإحصاء وعلوم الكمبيوتر. ذكر بريمر كذلك أن أياً من قراراتك لن يكون ملزماً. & # 8220 حتى إذا قمت باختيار سيئ & # 8221 مع شركة أو صناعة ، & # 8220 يمكنك المحاولة مرة أخرى! & # 8221 قالت ، متحدثة عن انتقالها من الاستشارات إلى تصور البيانات مع Adyen.

حتى في علم الفلك ، هناك فرص كبيرة لتطوير مهارات قوية كعالم بيانات. تقبل LSST Collaboration طلبات الحصول على أول برنامج زمالة في علوم البيانات ، بهدف تعليم طلاب الدراسات العليا المهارات الأساسية للتعامل مع أنواع البيانات الضخمة التي ستأتي من الاستطلاعات المستقبلية.

ومع ذلك ، فإن أكثر الموارد قيمة هم زملائنا علماء الفلك الذين يقومون بهذه التحولات بأنفسهم. بدأ الكثيرون في مناقشة اختياراتهم وأساليبهم في منشورات المدونة والمقابلات الأخرى. يمكن العثور على موارد أخرى عبر الإنترنت هنا وهنا. في مؤسستك الخاصة ، يمكنك التحدث إلى قسمك أو مكتبتك حول عقد اللوحات مثل تلك الملخصة هنا. سيكون قسمك هو أفضل مورد للعثور على الطلاب السابقين الذين يعملون الآن في وظائف خارج الأوساط الأكاديمية.

مناقشة جارية

إذا كنت & # 8217 مهتمًا بوظائف في علم البيانات ، فاستمر في المحادثة! قم بالتعليق أدناه بأسئلتك أو أفكارك أو تجاربك الشخصية حول الوظائف داخل / خارج الأوساط الأكاديمية. إذا كانت لديك موارد جيدة كانت مفيدة لك ، فيمكنك أيضًا الارتباط بها في التعليقات ، وسنقوم بإضافتها إلى هذه المشاركة.


الحصول على CARTA v2.0

  • نظام التشغيل Ubuntu Linux: 18.04 LTS (Bionic Beaver) ، 20.04 LTS (Focal Fossa)
  • ريد هات إنتربرايز لينكس: 7 ، 8
  • نظام التشغيل macOS: 10.15 (كاتالينا) ، 11 (بيج سور)

لنشر CARTA في مؤسستك كتطبيق مستند إلى الويب لعدة مستخدمين ، يرجى الرجوع إلى وثائق وحدة تحكم CARTA.

لبدء CARTA ، يرجى الرجوع إلى دليل المستخدم كيفية تشغيل CARTA.

حزمتي Ubuntu 18.04 و 20.04 متوفرة من PPA الخاص بنا.

sudo add-apt-repository ppa: cartavis-team / carta
sudo apt-get update
sudo apt تثبيت كارتا

لبدء CARTA ، يرجى الرجوع إلى دليل المستخدم كيفية تشغيل CARTA.

لمستخدمي Red Hat Enterprise Linux 7 ، تحتاج أولاً إلى إضافة مستودعات el7 'cartavis' و EPEL. يرجى ملاحظة أن الوصول إلى الجذر مطلوب ، ما لم تقم بالتثبيت في حاوية Docker.

sudo curl https://packages.cartavis.org/cartavis-el7.repo --output /etc/yum.repos.d/cartavis.repo
sudo rpm -ivh https://dl.fedoraproject.org/pub/epel/epel-release-latest-7.noarch.rpm
sudo yum -y تثبيت كارتا

لبدء CARTA ، يرجى الرجوع إلى دليل المستخدم كيفية تشغيل CARTA.

لمستخدمي CentOS7 ، تحتاج أولاً إلى إضافة مستودعات el7 'cartavis' و EPEL. يرجى ملاحظة أن الوصول إلى الجذر مطلوب ، ما لم تقم بالتثبيت في حاوية Docker.

sudo curl https://packages.cartavis.org/cartavis-el7.repo --output /etc/yum.repos.d/cartavis.repo
sudo yum -y install epel-release
sudo yum -y تثبيت كارتا

لبدء CARTA ، يرجى الرجوع إلى دليل المستخدم كيفية تشغيل CARTA.

لمستخدمي Red Hat Enterprise Linux 8 ، تحتاج أولاً إلى إضافة مستودعات el8 'cartavis' و EPEL. يرجى ملاحظة أن الوصول إلى الجذر مطلوب ، ما لم تقم بالتثبيت في حاوية Docker.

sudo curl https://packages.cartavis.org/cartavis-el8.repo --output /etc/yum.repos.d/cartavis.repo
sudo rpm -ivh https://dl.fedoraproject.org/pub/epel/epel-release-latest-8.noarch.rpm
sudo yum -y تثبيت كارتا

لبدء CARTA ، يرجى الرجوع إلى دليل المستخدم كيفية تشغيل CARTA.

لمستخدمي CentOS8 ، تحتاج أولاً إلى إضافة مستودعات el8 'cartavis' و EPEL. يرجى ملاحظة أن الوصول إلى الجذر مطلوب ، ما لم تقم بالتثبيت في حاوية Docker.

sudo curl https://packages.cartavis.org/cartavis-el8.repo --output /etc/yum.repos.d/cartavis.repo
sudo dnf -y install "dnf-command (config-manager)"
sudo dnf- تثبيت الإصدار epel
sudo dnf -y config-manager - مجموعة أدوات القوة الممكّنة
sudo dnf -y تثبيت كارتا

لبدء CARTA ، يرجى الرجوع إلى دليل المستخدم كيفية تشغيل CARTA.

ندعم رسميًا macOS 10.15 Catalina و macOS 11.0 Big Sur من خلال Homebrew.

إذا لم يكن لديك بالفعل ، فيمكنك تثبيت Homebrew باستخدام الأمر التالي (يلزم الوصول إلى الجذر):
/ bin / bash -c "$ (curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"

الآن يمكن تثبيت CARTA مع:
الشراب تثبيت كارتافيس / صنبور / كارتا

لبدء CARTA ، يرجى الرجوع إلى دليل المستخدم كيفية تشغيل CARTA.

يمكن تنزيل إصدار macOS Electron Desktop التقليدي بالنقر فوق زر التنزيل أدناه.
إذا كنت تستخدم جهاز Mac يستند إلى M1 ، فقد ترى أداءً أفضل مع إصدار Apple Silicon الأصلي من CARTA المتاح هنا.

التركيب:
انقر فوق زر التنزيل أدناه. بعد التنزيل ، افتح أداة تثبيت DMG واسحب أيقونة CARTA إلى مجلد التطبيقات.
عملية:
انقر على كارتا أيقونة في Launchpad.

بدلاً من ذلك ، يمكنك إنشاء اسم مستعار لبدء CARTA في جهازك.
هنا مثال:
افتح

/.باشرك إذا كنت تستخدم bash) في محرر نصي وأضف السطر التالي:
كارتا الاسم المستعار = '/ Applications / CARTA.app / المحتويات / MacOS / CARTA'
ثم أدخل المصدر

/.باشرك) في الصالة.
الآن ستتمكن من بدء تشغيل CARTA ببساطة عن طريق كتابة كارتا في المحطة.
تحميل

لا يتطلب تطبيق Ubuntu Linux AppImage الوصول إلى الجذر. يمكنك ببساطة تنزيله واستخراجه وتشغيله. يستخدم متصفح الويب الافتراضي الخاص بك لعرض واجهة CARTA الرسومية. تم اختبار AppImage للتشغيل على Ubuntu 18.04 و 20.04.

التركيب:
إما أن تنقر فوق الزر "تنزيل" أدناه أو قم بتشغيل:
wget https://github.com/CARTAvis/carta/releases/download/v2.0/CARTA-v2.0-ubuntu.tgz
استخراج كرة القطران:
القطران -xzf كارتا- v2.0-ubuntu.tar.gz
عملية:
لبدء CARTA ، يرجى الرجوع إلى دليل المستخدم كيفية تشغيل CARTA.

ملاحظة: إذا كنت ترغب في تشغيل AppImage داخل حاوية Docker ، أو كان نظامك يعاني من مشكلة مع FUSE ، فالرجاء البادئة بمتغير البيئة التالي:
APPIMAGE_EXTRACT_AND_RUN = 1 ./carta-v2.0-ubuntu.AppImage
تحميل

لا يتطلب تطبيق Red Hat Linux AppImage الوصول إلى الجذر. يمكنك ببساطة تنزيله واستخراجه وتشغيله. يستخدم متصفح الويب الافتراضي الخاص بك لعرض واجهة CARTA الرسومية. تم اختبار AppImage للتشغيل على Red Hat Enterprise Linux (RHEL) 7 و 8 ، بالإضافة إلى CentOS 7 و 8.

التركيب:
إما أن تنقر فوق الزر "تنزيل" أدناه أو قم بتشغيل:
wget https://github.com/CARTAvis/carta/releases/download/v2.0/CARTA-v2.0-redhat.tgz
استخراج كرة القطران:
القطران -xzf كارتا- v2.0- redhat.tar.gz
عملية:
لبدء CARTA ، يرجى الرجوع إلى دليل المستخدم كيفية تشغيل CARTA.

ملاحظة: إذا كنت ترغب في تشغيل AppImage داخل حاوية Docker ، أو كان نظامك يواجه مشكلة مع FUSE ، فيرجى إضافة متغير البيئة التالي:
APPIMAGE_EXTRACT_AND_RUN = 1 ./carta-v2.0-redhat.AppImage
تحميل

لمزيد من المعلومات ، يرجى الرجوع إلى دليل المستخدم.

في حالة وجود أي مشاكل أثناء التثبيت ، يرجى الاتصال بمكتب المساعدة CARTA.

للحصول على إصدارات الإصدار السابقة ، يرجى الرجوع إلى https://github.com/CARTAvis/carta/releases.


معمل الفيزياء الحديثة: الشروع في العمل

لماذا لدينا معمل على أي حال؟ قد تعتقد أنه & # 8217s فقط لتوضيح مادة الفصل. هذا & # 8217s سبب وجيه جدًا ، ولكنه ليس مرتبطًا جدًا بالدور الذي تلعبه المختبرات في العالم الحقيقي. نحن مهتمون أكثر بتوضيح كيف تؤدي الملاحظات المختبرية إلى وصف الطبيعة ، وفي السماح لك بتجربة كيف تؤدي القيود المتأصلة في العمل المخبري إلى عدم اليقين في هذا الوصف. إذا واصلت التركيز على هذه الأهداف أثناء عملك من خلال هذه المعامل ، فمن المحتمل أن تبدأ في التساؤل عن كيفية اعتماد العلوم المفترضة & # 8220exact & # 8221 بشكل كبير على العمل المخبري! ثم نكون قد نجحنا ، لأنك ستكون أكثر تشككًا في العلم بشكل عام وأكثر تقديراً لإنجازات التجريبين العظماء في التاريخ.

نحاول الحفاظ على التركيز قدر الإمكان على المختبر نفسه ، وبدرجة أقل على الجانب & # 8220publication & # 8221 من العلوم المهنية (الأكاديمية بشكل خاص). نؤكد التسجيل الأولي للبيانات التجريبية في دفتر ملاحظات معمل ، والتحليل الأولي لتلك البيانات لتحديد النتائج التجريبية. We ask you to develop a style of record-keeping that is practiced in real research laboratories, where it may be as important to establish the chronology of events as it is to describe those events accurately. You may sometimes feel as if we are imposing an arbitrary set of picky rules, but if you make this note taking style a habit, it will serve you well, even if you don’t become a professional scientist.

To keep you aware of the limits of laboratory observation, we ask you to calculate the “uncertainty” in your experimental results. We don’t call it “error analysis”, because that implies you did something wrong. You shouldn’t make errors, but you should be uncertain! We intend that uncertainty analysis be a significant but minor part of your work for each lab. In the past, students have done much more than we now require for this part of the lab, so don’t listen to what they tell you. Just follow the instructions that follow! If you aren’t sure how they apply in a given situation, ask us to make it clear before you start calculating. Briefly, we ask you to

1) estimate the “measurement uncertainty” once only for each variable that you measure, justifying your estimate (see “3XAP below”)
2) do a “partial uncertainty analysis” for a single data set
3) use the “standard deviation technique” when instructed to do so. We also require that you do all your analysis in Excel. The physics 108 Excel Tutorial describes this spreadsheet program. There is a link to this tutorial from the physics 108 webpage of from Lyceum.

We intend the lab to be interactive. We tried to write the lab handouts in a way that keeps you thinking about what you’re doing, but we also want you to consult freely with lab instructors, the student assistant, and other students. The questions in the lab handouts are meant to stimulate such conversation. In some cases there is no single answer, or the answer is beyond the scope of class material. We ask that you answer the questions as you come to them in lab, so it will be easier for you to discuss them with us.

To prepare for lab, you will be asked to complete a short pre-lab exercise prior to lab. The pre-lab, worth 10% of your lab grade, should be turned in at the beginning of you lab period. Pre-lab exercises for each lab are found in Lyceum.

The Lab Notebook

The most important thing to know is that it’s your notebook. You are writing notes in your own words, for you to read and understand later. It’s not a report that you’re writing for the instructor. It’s more like a diary. To keep the notebook organized, we ask that you reserve the first page of the notebook for a Table of Contents that you update for each lab with its title and the page number on which it starts.

Each experiment should begin with a title, purpose and your partner’s name. The notebook is supposed to be an accurate record of what happened when you did the lab. That means you write down what you do when you are doing it, not the night before or a few days later. It must be sufficiently detailed to “stand alone” that is, you or the grader should be able to understand what happened without also having to look at the lab handouts. Diagrams are especially helpful in accomplishing this. The notebook is supposed to indicate the order in which things happened. That means it’s strictly chronological. Never leave blank spaces with the idea of coming back later to fill them in unless you are leaving room for printed or other externally produced documents that are to be taped into the notebook.

Thus, during lab you write only in the notebook, never on “scrap paper”. It also means that if you make a mistake, you don’t erase, obliterate, use white-out, or tear out the page – just draw a single line through the mistake or a single cross through the page or section of page that should be ignored. You should still be able to read the supposedly mistaken information – it can happen that the mistake actually tells you something valuable that you’ll want to know later. The notebook is supposed to indicate when things happened, so each page must be dated. Because your notes are strictly chronological, you often need to refer back to something written earlier. That means the pages must be numbered like the pages of a book–if your first experiment ends on page 17, the second begins on page 18, and the last page in the book is page 160 or so. Sometimes you need to refer forward. If you break off an analysis on page 30 and pick it up again five pages later, label the break off point with something like “continued on page 35” (O.K., in this case you are allowed to write something out of strict chronological order!), and on page 35 write “continued from page 30”.

One of the best ways to establish uncertainty for your lab measurements is to perform multiple trials of the same measurement. We are going to use a method called 3XAP, or “three-times-alternating-partners”. For each new measurement type, performing it “3XAP” means that each member of a 3-person lab group should perform the measurement once without sharing the values until everyone has completed the measurement. For a lab group of 2 people, one of the members should perform a second trial, trying to reinitialize the measurement device when possible (for example, if measuring a length with a ruler, the person performing two trials should remove the ruler from the object being measured and realign the ruler on the object a second time). It is important that lab group members do not “agree” on measurements as each measurement is taken: the point of uncertainty measurement is to establish a reasonable degree to which a measurement could differ rather than to try to compromise on a “best” value. Make sure always to record all uncertainty data in your lab notebook.

One note about 3XAP measurements: if you use the same measurement tool more than once to make measurements, you don’t need to do 3XAP measurements each time. As an example, if you had a set of five cubes whose dimensions you had to measure with a ruler, you would not have to measure the dimensions of all five cubes using 3XAP for each one. Performing one measurement with 3XAP will establish the uncertainty in using the ruler, and you can assume that uncertainty for the remaining measurements will be the same as the uncertainty you established by the one 3XAP measurement.

Your conclusion should always restate the purpose of the lab, the final results and whether they agree with each other and/or an accepted value, greatest sources of uncertainty, and suggestions for improvement. Finally, the notebook is supposed to be a permanent record, so use pen only, and never insert loose papers. Use the tape provided in lab to immediately fasten individual computer plots or printouts to separate notebook pages. Also, be sure to tape data analysis spreadsheets/graphs in your notebook before turning it in. The pre-lab sheet, when returned to you, may also be taped directly into your lab notebook at the beginning of the lab write-up if you choose to do so, you are advised to leave space in your notebook to attach the pre-lab sheet at the beginning of the lab write-up when it is returned to you. Also, any additional pre-lab information (notes, equations . . .) you feel may be helpful can be added into the notebook at the beginning of the lab writeup.

Labs are due exactly one week from the ending time of your lab period. For example, if your lab meets on Tuesday, Week 1, your lab is due the following Tuesday morning labs are due at 11:00am and afternoon labs are due at 4:00pm. A lab turned in less than 19 hours late will receive a 2-point penalty. If the lab is more late it will receive a 5-point penalty for each 24 hour period after the due date and time until the lab is turned in. The maximum penalty for a late lab is 20 points. Labs turned in beyond 4 days late will receive a maximum grade of 20/40, however must still be completed in full (in-lab and take home analysis must be completed). Because labs are an important part of an introductory course and there are only 5 lab experiments, you must complete all 5 labs to pass the course!


Related Research Guides

  • Last Updated: Mar 23, 2021 3:45 PM
  • URL: https://libguides.libraries.claremont.edu/astronomy
  • Print Page

We partner with faculty, students, and staff to provide a vital physical and digital center for research, teaching, learning, and other forms of intellectual engagement at The Claremont Colleges. Our Core Values explain why we take such pride in our work. They are the source of our passion, energy, professionalism, and productivity. These commonly shared values guide everything we do: User-centeredness, inclusivity, innovation, collaboration, education, community, discovery, stewardship.


Career Profiles: Astronomer to Data Scientist

1) Location - I wanted to stay in the Bay Area where my family lives.

2) Flexibility - There were more jobs outside of academia, and thus it was easier to find one that was interesting to me and in the location I wanted.

3) Finances - My initial salary offers from industry were 2-3 times more than my initial salary offers from academic positions.

4) Lifestyle - I was tired of working evenings / weekends and feeling like my job was never done as a researcher. I wanted a job that was challenging and fulfilling, but also would allow me more work-life balance.

5) State of the field - Because data science is a newer field than astronomy I have the opportunity to make a bigger impact and do more innovative work.

6) Work environment - I wanted to work in an environment that was more collaborative and team based. I found that research work was very isolating and solitary.

7) Pace - I found the pace of research to be too slow. I wanted to work on projects that had a faster turn and shorter timelines.

  • Run A/B tests/experiments for the product team which are used to inform all product changes/decisions.
  • Advise company leadership in decision making based on historical data trends / usage of the product.
  • Develop internal tools for various people in the company to help them obtain the latest usage statistics, understand feature utilization, characterize behavior of the product, or pretty much answer any question that comes up which requires data analysis.
  • Large-scale data analysis to try and identify patterns, classify users, understand what is working and what isn't working within the product, help determine if our intuitions about our users are accurate etc.
  • Work with the engineering team to improve logging and perform quality assurance checks. Educate product managers and engineers in statistics and data analysis so that they can interpret the results of our experiments/tests on their own.
  • Interview candidates and help with recruiting.
  • Train new teammates and help with on-boarding / creating on-boarding materials.

I learned about my first data science position from a friend who worked at Yammer. He set up the interview. I found other positions through my university's career webpage, or the jobs pages of specific companies I was interested in working for. I applied to Facebook, Google, LinkedIn etc through their job pages. If at all possible, I suggest trying to connect with someone at the company when applying to jobs, instead of just applying through their web pages. I've written some blog posts about how to make the transition that might be helpful to anyone interested in data science [1] [2] [3].

My current job found me using a recruiter/head-hunting firm. They reached out to me on LinkedIn, and set up a meeting between me and the CTO. It's funny, I found it pretty challenging to find my first tech job (read my posts on that) but once I was at Yammer for a few months I started getting contacted by recruiters fairly regularly. It is my experience that the real challenge is to get the first company to believe that you can make the transition from scientist to techie, and once you've done that, it is easy to get subsequent jobs.

نعم. It's pretty hard to go back to academic research once you are out of the field for any length of time. I knew this when I decided to transition out. I feel pretty confident that I could go back to a teaching position in the future, but not research. There do seem to be an increasing number of jobs which combine data and astronomy research. I could imagine myself possibly going to a position like that in the future.

I don't feel like I have disappointed anyone. I was unhappy in academia/research and everyone close to me knew that. I think advisors, friends, and colleagues are excited that I found something that I like and makes me happy.