🔍
What REALLY is Data Science? Told by a Data Scientist - YouTube
Channel: unknown
[0]
لا يتعلق علم البيانات بصنع نماذج معقدة. الأمر لا يتعلق بعمل تصورات رائعة
[5]
الأمر لا يتعلق بكتابة علم بيانات الكود ، فهو يتعلق باستخدام البيانات لإنشاء أكبر قدر ممكن من التأثير لشركتك
[13]
الآن يمكن أن يكون التأثير في شكل أشياء متعددة
[15]
يمكن أن يكون في شكل رؤى في شكل منتجات البيانات أو في شكل توصيات المنتج للشركة
[22]
الآن للقيام بهذه الأشياء ، فأنت بحاجة إلى أدوات مثل صنع نماذج معقدة أو تصورات للبيانات أو كتابة التعليمات البرمجية
[30]
ولكن في الأساس كعالم البيانات
[32]
مهمتك هي حل مشاكل الشركة الحقيقية باستخدام البيانات وأي نوع من الأدوات التي تستخدمها لا يهمنا
[42]
الآن هناك الكثير من المفاهيم الخاطئة حول علم البيانات ، خاصة على YouTube
[46]
وأعتقد أن السبب في ذلك هو وجود اختلال كبير بين
[51]
ما يحظى بشعبية للحديث وما هو مطلوب في هذه الصناعة. ولهذا السبب أريد أن أوضح الأمور. أنا
[58]
أنا عالم بيانات يعمل لشركة GAFA و
[62]
تؤكد تلك الشركات حقًا على استخدام البيانات لتحسين منتجاتها
[67]
لذلك هذا هو بلدي يأخذ على ما هو علم البيانات
[81]
قبل علم البيانات ، قمنا بتعريف مصطلح استخراج البيانات في مقال يسمى من التنقيب عن البيانات إلى اكتشاف المعرفة في قواعد البيانات في
[89]
1996 حيث أشار إلى العملية الشاملة لاكتشاف معلومات مفيدة من البيانات
[96]
في عام 2001 ، أراد وليام كليفلاند جلب تعدين البيانات إلى مستوى آخر
[100]
لقد فعل ذلك من خلال الجمع بين علوم الكمبيوتر واستخراج البيانات
[104]
في الأساس
[105]
لقد جعل الإحصائيات تقنية أكثر بكثير مما اعتقد أنه سيوسع من إمكانيات استخراج البيانات وينتج قوة قوية للابتكار
[113]
الآن يمكنك الاستفادة من حساب القوة للإحصاءات ودعا هذا علم البيانات التحرير والسرد. في حوالي مثل هذا الوقت
[120]
يحدث هذا أيضًا عندما ظهر الويب 2.0 حيث لم تعد المواقع الإلكترونية مجرد كتيب رقمي ، ولكنها وسيلة للتجربة المشتركة
[128]
بين الملايين والملايين من المستخدمين
[131]
هذه هي مواقع الويب مثل MySpace في عام 2003
[134]
Facebook في 2004 و YouTube في 2005. يمكننا الآن التفاعل مع هذه المواقع
[140]
مما يعني أنه يمكننا المساهمة في نشر تعليق مثل مشاركة التحميل
[143]
ترك بصمتنا في المشهد الرقمي نسميه الإنترنت وتساعد على إنشاء وتشكيل النظام البيئي
[150]
نحن نعرف الآن ونحب اليوم. وتخيل ماذا؟
[153]
هذا كثير من البيانات الكثير من البيانات ، وأصبح التعامل معها باستخدام التقنيات التقليدية أكثر من اللازم. لذلك نحن نسمي هذه البيانات الكبيرة.
[161]
هذا فتح عالم من الاحتمالات في العثور على رؤى باستخدام البيانات
[164]
ولكن هذا يعني أيضًا أن أبسط الأسئلة تتطلب بنية تحتية متطورة للبيانات فقط لدعم معالجة البيانات
[172]
نحن بحاجة إلى تكنولوجيا الحوسبة المتوازية مثل MapReduce و Hadoop و Spark
[176]
حتى ظهور البيانات الكبيرة في
[179]
أثار عام 2010 ظهور علم البيانات لدعم احتياجات الشركات لاستخلاص رؤى من مجموعات البيانات الضخمة غير المنظمة
[186]
إذن ، وصفت مجلة علم البيانات علم البيانات على أنه كل شيء تقريبًا له علاقة بالبيانات
[193]
جمع تحليل النمذجة. بعد الجزء الأكثر أهمية هو تطبيقاتها. جميع أنواع التطبيقات.
[201]
نعم ، كل أنواع التطبيقات مثل التعلم الآلي
[204]
حتى في عام 2010 مع وفرة جديدة من البيانات
[207]
جعلت من الممكن لتدريب الآلات مع نهج يحركها البيانات
[211]
بدلا من نهج المعرفة مدفوعة. أصبحت جميع الأوراق النظرية حول الشبكات العصبية المتكررة التي تدعم الآلات المتجهة ممكنة
[219]
شيء يمكن أن يغير الطريقة التي نعيش بها وكيف نختبر الأشياء في العالم
[223]
لم يعد التعلم العميق مفهومًا أكاديميًا في ورقة البحث هذه
[228]
أصبح فئة مفيدة ملموسة من التعلم الآلي التي من شأنها أن تؤثر على حياتنا اليومية
[233]
لذا سيطر التعلم الآلي و الذكاء الاصطناعي على وسائل الإعلام التي تلقي بظلالها على كل الجوانب الأخرى لعلوم البيانات
[240]
مثل التحليل الاستكشافي ،
[242]
التجريب ، ... والمهارات التي نسميها عادة ذكاء الأعمال
[247]
حتى الآن الجمهور العام يفكر في علم البيانات كما
[251]
ركز الباحثون على التعلم الآلي والذكاء الاصطناعى ولكن الصناعة تقوم بتعيين علماء البيانات كمحللين
[257]
لذلك هناك اختلال هناك
[259]
سبب الاختلال هو أن نعم ، يمكن لمعظم علماء البيانات أن يعملوا على حل مشكلات فنية أكثر
[266]
لكن الشركات الكبرى مثل Google Facebook Netflix لديها الكثير من الفواكه المنخفضة المعلقة لتحسين منتجاتها بحيث لا تتطلب أيًا منها
[273]
تعلم الآلة المتقدمة أو
[275]
المعرفة الإحصائية للعثور على هذه الآثار في تحليلهم
[279]
كونك عالم بيانات جيدًا لا يتعلق بمدى تقدم نماذجك
[283]
إنها تدور حول مدى تأثيرك على عملك. أنت لست من محبي البيانات. أنت مشكلة حلال
[290]
أنت استراتيجيون. ستعطيك الشركات أكثر المشاكل غموضًا وصعوبة. ونتوقع منك أن توجه الشركة إلى الاتجاه الصحيح
[298]
حسنًا ، أريد الآن أن أختتم أمثلة واقعية عن وظائف علم البيانات في وادي السيليكون
[304]
لكن أولاً يجب علي طباعة بعض الرسوم البيانية. لذلك دعونا نذهب نفعل ذلك
[315]
(محادثة لا تتعلق مباشرة بالموضوع)
[334]
(محادثة لا تتعلق مباشرة بالموضوع)
[361]
إذاً هذا مخطط مفيد جدًا يخبرك باحتياجات علم البيانات. الآن ، هو واضح جدا
[368]
لكن في بعض الأحيان ننسى الأمر الآن
[370]
في الجزء السفلي من الهرم الذي نجمعه ، من الواضح أنه يتعين عليك جمع نوع من البيانات لتتمكن من استخدام هذه البيانات
[377]
لذا فإن جمع تخزين تحويل كل هذه الجهود لهندسة البيانات أمر مهم للغاية وهو فعال
[383]
في الواقع يتم التقاطها بشكل جيد في الوسائط بسبب البيانات الضخمة التي تحدثنا عنها حول مدى صعوبة إدارة جميع هذه البيانات
[390]
تحدثنا عن الحوسبة المتوازية التي تعني مثل Hadoop و Spark
[396]
أشياء من هذا القبيل. نحن نعرف عن هذا. الآن الشيء الأقل شهرة هو الأشياء الموجودة هنا
[403]
كل شيء هنا و
[405]
من المدهش أن هذا هو في الواقع أحد أهم الأمور بالنسبة للشركات لأنك تحاول إخبار الشركة
[411]
ماذا تفعل مع المنتج الخاص بك. إذن ماذا أقصد بذلك؟ لذلك أنا تحليلات يخبرك
[417]
باستخدام البيانات ، ما نوع الرؤى التي يمكن أن تخبرني بما يحدث للمستخدمين ، ثم يعد هذا الأمر مهمًا
[424]
ما الذي يحدث مع المنتج الخاص بي؟
[425]
كما تعلمون ، ستخبرك هذه المقاييس ما إذا كنت ناجحًا أم لا. وبعد ذلك أيضًا ، أنت تعرف أن يكون اختبارًا بالطبع
[432]
التجربة التي تسمح لك بمعرفة أي إصدارات المنتج هي الأفضل
[437]
إذاً هذه الأشياء مهمة حقًا لكنها غير مغطاة في وسائل الإعلام. ما هو مغطى في وسائل الإعلام
[441]
هل هذا الجزء منظمة العفو الدولية ، التعلم العميق. لقد سمعنا ذلك وعلى ذلك ، كما تعلمون
[446]
ولكن عندما تفكر في ذلك لشركة ، للصناعة ،
[449]
إنه في الواقع ليس أولوية قصوى أو على الأقل ليس الشيء الذي يحقق أكبر نتيجة بأقل قدر من الجهد
[456]
هذا هو السبب في أن التعلم المتعمق الذكاء الاصطناعي يتصدر التسلسل الهرمي للاحتياجات وقد تكون هذه الأشياء بمثابة اختبار تحليلي
[464]
انهم في الواقع وسيلة أكثر أهمية للصناعة
[466]
لهذا السبب نحن نوظف الكثير من علماء البيانات الذين يقومون بذلك. فماذا فعل علماء البيانات في الواقع؟
[472]
حسنًا ، هذا يعتمد على الشركة بسبب حجمها
[475]
لذلك بالنسبة للشركات الناشئة ، فأنت تفتقر إلى الموارد
[478]
لذلك يمكنك فقط الحصول على نوع DS واحد. بحيث عالم البيانات واحد
[482]
عليه أن يفعل كل شيء. لذلك قد تكون رؤية كل هذا
[485]
كونها علماء البيانات. ربما لن تقوم بعمل الذكاء الاصطناعى أو التعلم العميق لأن هذا ليس أولوية الآن
[491]
ولكن قد تكون تفعل كل هذه. يجب عليك إعداد البنية الأساسية للبيانات بالكامل
[495]
قد تضطر حتى إلى كتابة بعض التعليمات البرمجية البرمجية لإضافة تسجيل ثم عليك القيام بالتحليلات
[501]
نفسك ، ثم عليك بناء المقاييس بنفسك ، وعليك أن تفعل A / B اختبار نفسك. لهذا
[506]
بالنسبة للشركات الناشئة إذا احتاجوا إلى عالم بيانات فإن هذا الأمر برمته
[510]
علم البيانات ، وهذا يعني أن عليك أن تفعل كل شيء. ولكن دعونا ننظر إلى الشركات المتوسطة الحجم. الان اخيرا
[517]
لديهم الكثير من الموارد. يمكنهم فصل مهندسي البيانات وعلماء البيانات
[522]
لذلك عادة في المجموعة ، وهذا ربما هندسة البرمجيات. و
[527]
ثم هنا ، سيكون لديك مهندسي بيانات يقومون بذلك. ثم حسب ما إذا كنت شركة متوسطة الحجم تفعل الكثير
[535]
نماذج التوصية أو الأشياء التي تتطلب AI ، ثم DS سوف تفعل كل هذه
[540]
حق. لذلك كعالم بيانات ، يجب أن تكون أكثر تقنية بكثير
[543]
لهذا السبب يقومون بتوظيف أشخاص يحملون شهادات الدكتوراه أو الماجستير لأنهم يريدون منك أن تكون قادرًا على القيام بالأشياء الأكثر تعقيدًا
[551]
لذلك دعونا نتحدث عن شركة كبيرة الآن
[553]
لأنك تكبر كثيرًا
[555]
ربما لديك الكثير من المال ومن ثم يمكنك إنفاق المزيد على الموظفين
[558]
لذلك يمكن أن يكون لديك الكثير من الموظفين المختلفين الذين يعملون على أشياء مختلفة. بهذه الطريقة
[562]
لا يحتاج الموظف إلى التفكير في هذه الأشياء التي لا يريدون القيام بها ويمكنهم التركيز على الأشياء التي يريدونها
[567]
الأفضل في. على سبيل المثال ، أنا وشركتي الكبيرة بدون عنوان
[571]
سأكون في التحليلات حتى أتمكن فقط من تركيز عملي على التحليلات والمقاييس وأشياء من هذا القبيل
[577]
لذلك لا داعي للقلق حول هندسة البيانات أو الذكاء الاصطناعي العميق
[581]
لذلك هنا كيف تبدو لشركة كبيرة
[585]
أجهزة استشعار تسجيل مفيدة. كل هذا يتم معالجته بواسطة مهندسي البرمجيات
[589]
حق؟ ثم هنا ، تنظيف وبناء خطوط أنابيب البيانات
[593]
هذا هو لمهندسي البيانات. الآن هنا ، بين هذين الأمرين ، لدينا بيانات
[600]
تحليلات العلوم. هذا ما يطلق عليه
[604]
ولكن بمجرد أن نذهب إلى الذكاء الاصطناعي والتعلم العميق ، هذا هو المكان الذي لدينا
[608]
علماء البحوث
[612]
أو نسميها علم البيانات الأساسية
[616]
ويدعمهم والآن المهندسين الذين هم مهندسي التعلم الآلي. بلى
[623]
على أي حال ، هكذا باختصار ، كما ترون ، يمكن أن يكون علم البيانات كل هذا ويعتمد على الشركة التي تعمل فيها
[631]
التعريف سوف يختلف. لذا ، اسمحوا لي أن أعرف ما الذي ترغب في معرفة المزيد حول التعلم العميق AI ، أو اختبار A / B ،
[638]
التجريب ، ... اعتمادا على ما تريد أن تتعلم عنه
[641]
اترك تعليقًا لأسفل أدناه حتى أتمكن من التحدث عن ذلك أو يمكنني العثور على شخص يعرف هذا ويمكنني مشاركة
[647]
رؤى معك
[649]
لذا ، نعم ، إذا أعجبك هذا الفيديو ، فلا تنسى الإعجاب والاشتراك
[652]
إذن أجل. اتمنى ان تحظا بيوم رائع. آمل أن يكون هذا مفيدًا. ولكن نعم ، شكرا للمشاهدة
[657]
سلام.
Most Recent Videos:
You can go back to the homepage right here: Homepage





