0

Ich bin derzeit interessiert an der Arbeit und Studium von Big Data Analytics und Web Analytics, aber ich weiß nicht, wie und wo ich anfangen soll. Ich habe versucht, im Internet zu suchen, aber einige sind für mich voraus. Gibt es Fähigkeiten, Kenntnisse in Statistik und Mathematik, die ich brauche, bevor ich diesen Weg gehe?Wie Sie in Big Data und Web Analytics beginnen

Mein aktueller Plan ist es, an Wochenenden online Kurse zu besuchen, da ich derzeit als Associate Software Engineer wochentags arbeite und Programmiersprachen für Big Data wie R üben. Ich habe bereits einen Abschluss in Informatik mit der Vertrautheit Einige statistische und mathematische Methoden sind kein Problem. Irgendwelche Vorschläge und Kommentare werden sehr geschätzt!

Für diejenigen, die bereits eine Erfahrung haben, wie ist Ihre Erfahrung und was arbeiten Sie am meisten?

Antwort

2

Ich bin in einem ähnlichen Boot wie Sie. Ich arbeite in einer Web-Entwicklungsabteilung als Business Analyst. Ich mache einige Software-Entwicklung, Data Mining und Datenvisualisierung, aber ich verbessere ständig meine Fähigkeiten, weil es für mich ziemlich interessant ist, und es macht mich zu einem extrem vielseitigen Mitarbeiter.

Web Analytics/Big Data
Sehen Sie, wenn Sie in Ihrem Unternehmen Zugang zu Google Analytics-Konto lesen bekommen können, vorausgesetzt, sie haben eine Website. Die API ist wirklich gut und vorgefertigte Pakete in R machen es wirklich einfach, große Datenmengen zu erhalten. Wenn ihre Website groß genug ist, können Sie ganz einfach eigene, echte Datensätze erstellen. Während diese wahrscheinlich nicht "groß" wie in "Big Data" sein werden, sind sie definitiv großartig, um Datenvisualisierungen zu üben. Ich würde vorschlagen, Shiny und R Markdown zu lernen. Sie können problemlos Webstatistik-Visualisierungen erstellen, die Sie mit Ihrem Unternehmen teilen können. Wenn Sie Probleme mit der Menge an Daten haben, die Sie verarbeiten möchten (z. B. wenn sie über eine große Webpräsenz verfügen), können Sie Spark zur Verarbeitung großer Datenmengen verwenden. Coursera hat eine Spezialisierung auf Big Data - https://www.coursera.org/specializations/big-data. Sie können alle Klassen kostenlos nehmen, wenn Sie sie nur "auditieren". Sie erhalten kein Zertifikat oder irgendetwas, aber Sie erhalten Zugriff auf das gesamte Kursmaterial. Sie gehen anscheinend durch Spark, Hadoop, Pig und Hive. Ich habe es nicht genommen, aber die UCSD Coursera-Klassen, die ich belegt habe, waren ziemlich gut.

Offensichtlich ist Coursera nicht das Ende-all-all-all ... Schau auch auf edx.org, Pluralsight, Udemy, etc ... Du kannst eine kostenlose Pluralsight-Mitgliedschaft für ein Jahr bekommen - einfach Google. Meins war irgendwie durch Microsoft. Meine Lieblingskurse von Pluralsight waren (ohne Bezug zu Daten/Analysen) Ethical Hacking. Udemy hat oft erstaunliche Angebote für HUGE-Kurse - wie 21 Stunden Vorträge über Python für Datenanalyse und solche Sachen. Melden Sie sich einfach für den Service an, und Sie erhalten in einer oder zwei Wochen ein "Sonderangebot". Sie sind normalerweise $ 10-20. https://www.brighttalk.com/ ist auch ein guter Ort für Webinare und Vorträge im Zusammenhang mit Data Science/Analytics.

Datenbanken
Meine Firma verwendet SQL Server (Microsoft), so nahm ich auch einige Datenbankklassen auf MVA (Microsoft Virtual Academy). Sie haben eine Reihe von Klassen von komplettem Noob bis zum Auffrischen von Fähigkeiten: MVA Database Stuff.

Datensätze
Wenn Sie sich um große Datensätze zu finden, Kaggle beizutreten. Sie verfügen oft über großartige Datensätze für maschinelles Lernen, aber Sie können sie selbst verwenden, um Visualisierungen zu minen und zu machen. Ich würde insbesondere nach beschrifteten Datensätzen suchen. Viele der größeren Sets sind komplett anonymisiert - keine Etiketten, nichts. Aber das macht nicht viel Spaß, wenn man nur herumkrabbelt. Darüber hinaus hat jemand eine Reihe von öffentlichen Datenquellen hier zusammengestellt: https://github.com/caesar0301/awesome-public-datasets. Schließlich ist NYC Open Data einer meiner Lieblingsplätze, um Nettodatensätze zu erhalten.Einige sind super langweilig, aber es gab einige coole Analysen done on parking tickets und dergleichen.

Mehr ...
Wenn Sie nur für mehr Klassen suchen https://www.metacademy.org/ zu nehmen oder Bücher zu lesen, zu sehen. Sie haben ein paar vorgeschlagene Wege, um tiefes Lernen, maschinelles Lernen, Bayes'sche Statistiken und ähnliches zu lernen. Ich denke, maschinelles Lernen ist ein ausgezeichneter nächster Schritt - wenn Sie sich mit Softwareentwicklung, Datenbankverwaltung/Erstellung/Abfrage und Visualisierung auskennen.

Noch mehr ...
Tauchen Sie einfach ein. Es gibt jede Menge Datenblogs, Podcasts, Meetup-Gruppen, Konferenzen und Neuigkeiten. Tun Sie alles, um hineinzukommen und herauszufinden, was vor sich geht und wer was macht. Es ist sowieso super interessant. Zwei meiner Lieblingssachen folge ich: datatau (Hacker Nachrichten für Data Science) und ich Quant NY (oben verlinkt, für Parktickets).

+1

Vielen Dank für diese detaillierte Informationen. Denkst du, ich muss an Präsenzkursen/Bootcamps teilnehmen, um eine komplette Schicht zu dieser Karriere zu machen? Obwohl ich denke, dass es für mich schwierig sein würde, dies zu tun, da es irgendwie teuer ist. Trotzdem, DANKE! – Vaanz

+0

Ich habe einige beeindruckende Statistiken aus diesen Bootcamps über ihre Platzierungsraten nach der Fertigstellung gesehen. ALLES, was ich von Einstellungsmanagern über maschinelles Lernen, Datenwissenschaft und Datenanalyse höre, ist jedoch, dass Erfahrung alles übertrifft. Das bedeutet, sich selbstständig mit Daten zu beschäftigen, Fallstricke zu lernen usw. Sie sollten in einem Blog Schritt-für-Schritt-Informationen darüber führen, wie Sie eine Analyse durchgeführt haben, wo es schief gelaufen ist, und Ihre Ergebnisse erläutern. Dies kommt auch in die Kommunikation der Datenwissenschaft, was auch sehr wichtig ist, da Sie Ihre Ergebnisse regelmäßig Laien präsentieren werden. – doctaj

Verwandte Themen