Το βιβλίο Πιθανότητες και στατιστική στην επιστήμη των δεδομένων αφορά μεν τη «μαθηματική στατιστική» (οικογένειες κατανομών, αναμενόμενες τιμές, εκτιμήσεις τιμών, κ.ο.κ.), αλλά δίνει ιδιαίτερη έμφαση στο σκέλος της «επιστήμης των δεδομένων» που περιλαμβάνεται στον τίτλο:
- Με εκτενή χρήση συνόλων δεδομένων από πραγματικές, καθημερινές περιπτώσεις
- Με προγράμματα, γραμμένα στη γλώσσα R, τα οποία υποστηρίζουν τις αναλύσεις των δεδομένων
- Με αναφορές σε πολλές εφαρμογές της επιστήμης των δεδομένων, όπως είναι, μεταξύ άλλων, η ανάλυση κύριων συνιστωσών (PCA), η μίξη κατανομών, τα μοντέλα τυχαίων γράφων, τα κρυφά μαρκοβιανά μοντέλα, τα νευρωνικά δίκτυα, καθώς και η γραμμική και λογιστική παλινδρόμηση
- Με κατάλληλη καθοδήγηση των φοιτητών, τους οποίους βοηθά να εξετάζουν με κριτική σκέψη τα «πώς» και τα «γιατί» της στατιστικής και να βλέπουν σε κάθε περίπτωση τη γενική εικόνα
- Με διατύπωση εννοιών και μοντέλων με ακριβή τρόπο από μαθηματική άποψη, αλλά χωρίς την προσκόλληση στο κλασικό δίπολο «διατύπωσης του θεωρήματος και απόδειξης»
Οι προαπαιτούμενες γνώσεις που είναι καλό να έχετε για να αξιοποιήσετε το βιβλίο είναι κάποιες γνώσεις μαθηματικού λογισμού και άλγεβρας πινάκων, καθώς και κάποια πείρα στον προγραμματισμό Η/Υ.
Περιεχόμενα:
- Βασικά μοντέλα πιθανοτήτων
- Προσομοίωση Monte Carlo
- Διακριτές τυχαίες μεταβλητές: Αναμενόμενη τιμή
- Διακριτές τυχαίες μεταβλητές: Διακύμανση
- Διακριτές παραμετρικές οικογένειες κατανομών
- Συνεχή μοντέλα πιθανοτήτων
- Στατιστική: Πρόλογος
- Προσαρμογή συνεχών μοντέλων
- Η οικογένεια των κανονικών κατανομών
- Εισαγωγή στη στατιστική συμπερασματολογία
- Πολυδιάστατες κατανομές
- Η οικογένεια των πολυδιάστατων κανονικών κατανομών
- Μίξη κατανομών
- Δεδομένα πολλών μεταβλητών: Περιγραφή και τεχνικές μείωσης της διάστασης
- Προβλεπτική μοντελοποίηση
- Οικονομία μοντέλου και υπερπροσαρμογή
- Εισαγωγή στις μαρκοβιανές αλυσίδες διακριτού χρόνου
- Γρήγορη εισαγωγή στην R
- Άλγεβρα πινάκων