Als eines der leistungsfähigsten Open-Source-Programmierframeworks ist Hadoop ein wichtiges Werkzeug für alle, die auf einen Big-Data-Job hoffen. Wenn Sie Ihre Hadoop-Kenntnisse auffrischen oder lernen möchten, wie Sie sie meistern, sollten Sie am besten einen Online-Kurs belegen. Wenn Ihnen das nicht zur Verfügung steht, sehen Sie sich kostenlose Online-Tutorials an und verwenden Sie Referenzmaterialien, um bestimmte Probleme zu beheben. Sobald Sie die Grundlagen haben, üben Sie auf kleinen Sets von realen Daten, um Ihre Fähigkeiten zu verbessern.
Methode eins von zwei:
Kurse belegen und Tutorials verwenden
- 1 Melden Sie sich für Cloudera für einen 6-teiligen Kurs und interaktive Tutorials an. Cloudera bietet praktische Beispiele zum Üben in einer schreibgeschützten Umgebung, sodass Sie sich keine Gedanken über große Fehler machen müssen. Sie bieten außerdem Analysetools, mit denen Sie Daten abfragen können, sowie eine kostenlose Live-Demo namens Cloudera Live, die Ihnen beim Erlernen der Hadoop-Umgebung hilft.[1]
- Obwohl der vollständige, vertiefte Kurs mit Zertifizierung Sie 295 $ kostet, wird es sich definitiv lohnen, wenn Sie diese Fähigkeiten für Ihre Arbeit verwenden. Die Verwendung des Cloudera-Kurses hilft Ihnen dabei, Fehler zu erkennen und Zeit zu sparen, was sich schnell bezahlt macht![2]
- 2 Versuchen Sie kostenlose Online-Kurse durch Cloudera, wenn Sie bereits die Grundlagen kennen. Wenn Sie Erfahrung mit Hadoop haben und nur eine Auffrischung möchten, müssen Sie das Geld für den 6-teiligen Kurs möglicherweise nicht ausgeben. Schauen Sie sich stattdessen die kostenlosen Online-Kurse auf der Cloudera University Website an.[3]
- Es gibt Ressourcen für Administratoren, Entwickler und Datenanalysten. Egal, welche Rolle Sie haben, Sie sollten in der Lage sein, einen passenden Kurs zu finden.
- 3 Wenn Sie mehr Theorie wünschen, sollten Sie einen Kurs auf Coursea besuchen. Coursera ist eine bekannte, angesehene Quelle von Programmierkursen. Obwohl die Anweisungen im Allgemeinen eher theoretisch sind und nicht so viele laufende Beispiele enthalten, können Sie neben dem Tutorium üben und die Kursprojekte verwenden, um praktische Erfahrung zu sammeln.[4]
- Sie können diesen Kurs online unter https://www.coursera.org/specializations/big-data finden.
- Die Kosten variieren zwischen den Kursen, aber Coursera bietet auch eine finanzielle Hilfe Option für diejenigen, die sich qualifizieren.
- 4 Folgen Sie einem kostenlosen Kurs an der Big Data University für eine kostenfreundliche Option. Wenn Sie nicht für einen Online-Kurs bezahlen möchten, ist Big Data University eine gute Option. Sie haben einen zweiteiligen Kurs, der sich zunächst auf Hadoop-Grundlagen und dann auf die Programmierung mit Hadoop konzentriert. Das Online-Format ermöglicht es Ihnen, in Ihrem eigenen Tempo zu gehen.[5]
- Sie finden diese Kurse unter https://cognitiveclass.ai.
- Sie bieten viele Tutorials in Englisch, Japanisch, Spanisch, Portugiesisch und Russisch.
- 5 Suchen Sie nach Walkthroughs auf YouTube, wenn Sie ein kostenloses, spezifisches Training benötigen. Es gibt Tausende von Videos, die Hadoop erklären und erklären, wie man es nutzt. Die große Auswahl an Videos gibt Ihnen Flexibilität und es ist kostenlos. Wenn Sie auf ein bestimmtes Problem stoßen, suchen Sie auf YouTube nach einem Video, das Sie durch den Prozess führt.[6]
- Hadoop-Tutorials sollten auch relativ einfach zu finden sein, da "hadoop" ein eindeutiger Suchbegriff ist.[7]
- 6 Verwenden Sie Yahoo kostenlose Tutorials, wenn Sie mit einem virtuellen Beispiel üben möchten. Diese Tutorials sind in 7 Module unterteilt, die Sie von Anfang an auf die Installation und den Betrieb von Hadoop hinweisen. Dies ist eine großartige Option, um bestimmte Fähigkeiten aufzupeppen, wenn sie ein wenig eingerostet sind.[8]
- Sie finden diese Tutorials kostenlos unter https://developer.yahoo.com/hadoop/tutorial/.
- 7 Weitere Informationen finden Sie im IBM Open Source-Dokument. Dies ist ein unglaublich gründliches Open-Source-PDF-Dokument, das von einer IBM-Schulungsinitiative erstellt wurde. Es führt Sie Schritt für Schritt durch Hadoop und gibt Ihnen klare Anweisungen.
- Sie finden dieses PDF unter https://www.ibm.com/developerworks/data/library/techarticle/dm-1209hadoopbigdata/.
- Diese Anweisungen funktionieren auch gut, wenn sie mit einer Live-Demo wie Cloudera kombiniert werden.[9]
Methode zwei von zwei:
Übergang zur realen Anwendung
- 1 Fragen Sie, ob Sie Hadoop bei der Arbeit implementieren können, um mit echten Daten zu üben. Setzen Sie eine Anfrage mit Ihrem Chef oder Vorgesetzten ein oder sprechen Sie mit ihnen persönlich darüber, wie Sie diese neuen Fähigkeiten in den Arbeitsplatz bringen können. Dies ist besonders wichtig, wenn Ihr Unternehmen für Schulungen oder Online-Kurse bezahlt.[10]
- Je früher Sie anfangen, die Fähigkeiten, die Sie gelernt haben, zu implementieren, desto eher werden Sie in der Lage sein, sie zu meistern!
- 2 Suchen Sie nach einfachen Projekten, um Ihre Fähigkeiten zu üben. Wählen Sie Projekte, die relativ einfach und risikoarm sind, z. B. das Zählen und Ranking der Anzahl von Interaktionen pro Kundenagenten, wie E-Mails und Chat-Sitzungen.[11]
- Einige andere echte Datenanwendungen umfassen das Durchsuchen von Weblogs auf Fehler oder das Überwachen von Social Media-Kanälen auf Markengefühl.
- Sie können auch mit Beispieldaten von Websites wie https://www.kaggle.com/datasets oder https://aws.amazon.com/datasets/ üben.
- 3 Überprüfen Sie Ihren Code regelmäßig mit kleinen Untergruppen, um Fehler zu beheben. Bevor Sie den gesamten Datensatz ausführen, nehmen Sie einen kleineren Testdatensatz auf Ihren lokalen Computer und führen Sie ihn durch verschiedene Modi. Zum Beispiel könnten Sie es iterativ über den lokalen Job-Runner-Modus, dann den pseudo-verteilten Modus und dann den vollständig verteilten Modus ausführen.[12]
- Auf diese Weise können Sie etwaige Fehler oder Fehler erkennen, bevor sie im vollständigen Dataset verstärkt werden.
- Mit dem lokalen Job-Runner-Modus können Sie lokal Ihren Map- und Reduce-Code testen und debuggen, der pseudo-verteilte Modus simuliert die Produktionsumgebung und der vollständig verteilte Modus prüft Ihren realen Produktionscluster.
- 4 Verwenden Sie eine einjährige kostenlose Testversion, um in einer virtuellen Computerumgebung zu üben. Unternehmen wie Amazon und Microsoft bieten kostenpflichtige Abonnements für ihre Hadoop-Übungsdienste an.Die virtuelle Maschine von Amazon heißt Amazon Web Service (AWS) und der Microsoft-Dienst heißt Microsoft Azure. Für beide Dienste ist Ihr erstes Jahr kostenlos, wenn Sie Ihre Kreditkarteninformationen eingeben.[13]
- Vergessen Sie nicht, das Abonnement nach 1 Jahr zu kündigen, um nicht belastet zu werden.
Facebook
Twitter
Google+