Skip to content

epal-aliartou/voice_assist

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

28 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Ψηφιακός ηχητικός βοηθός - (voice assistant)

Στο έργο αυτό προτείνουμε την κατασκευή ενός συστήματος ψηφιακού ηχητικού βοηθού.

Ομάδα: "voice_assist" Μαθητές Αλιάρτου

Τίτλος έργου: «Ψηφιακός ηχητικός βοηθός »


Α. Σχεδιάγραμμα της ιδέας

Στο έργο αυτό προτείνουμε την κατασκευή ενός συστήματος ψηφιακού ηχητικού βοηθού.



Στην μέρες μας υπάρχουν πολλοί ψηφιακοί βοηθοί από μεγάλες εταιρείες (όπως google ,apple ,amazon κ.τ.λ). Τα συστήματα αυτά είναι πολύ βοηθητικά για την καθημερινότητά μας. Το κοινό μεταξύ τους είναι ότι χρησιμοποιούν εξειδικευμένες (και αρκετά ακριβές συσκευές) , οι υπηρεσίες τους απαιτούν σύνδεση μέσω διαδικτύου με τον server της εταιρείας , δεν μπορούν να επικοινωνήσουν μεταξύ τους , και τέλος μπορούν να ελέγξουν μόνο ένα μικρό πλήθος συσκευών συγκεκριμένων εταιρειών.


Ψηφιακός ηχητικός βοηθός


Η προσπάθεια μας είναι να φτιάξουμε ένα δικό μας παρόμοιο "οικοσύστημα" αποτελούμενο από software και hardware , πάντα με ανοιχτό και ελεύθερο λογισμικό και υλικό , το οποίο θα μπορούμε να διαχειριστούμε τοπικά και να ελέγξουμε τόσο εμπορικές συσκευές όσο και δικές μας κατασκευές.

Συνεπώς το σύστημά μας δεν θα είναι δεσμευμένο και εξαρτώμενο από εξωτερικές υπηρεσίες καθώς επίσης θα είναι πλήρως επεκτάσιμο.

Τι παρόμοιο υπάρχει - Τρέχουσα αντιμετώπιση προβλήματος

Στην προσπάθειά μας να ερευνήσουμε την τρέχουσα κατάσταση και να παρατηρήσουμε τι λύσεις υπάρχουν σε παρόμοια προβλήματα καταλήξαμε στις παρακάτω διαπιστώσεις:

  • Υπάρχουν αρκετές λύσεις στο συγκεκριμένο πεδίο .
  • Όμως οι περισσότερες βασίζονται σε κλειστές εταιρικές λύσεις και μάλιστα ιδιαίτερα ακριβές.
  • Ο χρήστης τους είναι εγκλωβισμένος στην χρήση μόνο συστημάτων της "Εταιρείας-Λύσης", που θα επιλέξει, χωρίς να μπορεί να συνδυάσει τα καλά διαφόρων συστημάτων.
  • Επίσης πάντα οι προτεινόμενες λύσεις δεν μπορούν να προσαρμοστούν απόλυτα στις ανάγκες ελέγχου που θα θέλαμε εμείς και ούτε να μας δώσουν τη δυνατότητα προγραμματισμού εκ μέρους μας.

Προφανώς η δική μας λύση είναι σε αντιδιαμετρικά αντίθετη κατεύθυνση. Υιοθετώντας ανοιχτές τεχνολογίες και πλήρη έλεγχο στον προγραμματισμό και στην ανάπτυξη της πλατφόρμας έχουμε την πλήρη ελευθερία , ιδιωτικότητα και έλεγχο , που είναι και τα ζητούμενα. Μπορούμε να ενσωματώσουμε μετρητές , αισθητήρες , ελεγκτές τους καλύτερους που εμείς θα επιλέξουμε ανεξάρτητα εταιρείας επωφελούμενοι έτσι των συγκριτικών πλεονέκτημάτων του καθενός

Αναγκαιότητα του Έργου - Στόχοι

Σύμφωνα με την ανάλυση των δεδομένων που παρουσιάστηκαν στην προηγούμενη παράγραφο, προέκυψε η ιδέα και η πρόταση για το παρόν σύστημα.

Πιο συγκεκριμένα το σύστημα που προτείνουμε έχει τα παρακάτω χαρακτηριστικά τα οποία προσπαθούν να λύσουν τα προβλήματα που προέκυψαν κατά την έρευνά μας. Τα προτεινόμενα και επιθυμητά χαρακτηριστικά είναι τα εξής:

  • Να ακολουθεί ανοικτά πρότυπα

  • Να είναι επεκτάσιμο

  • Να μπορεί να διασυνδέει υπάρχοντα συστήματα

  • Να δίνει την δυνατότητα προγραμματισμού στον χρήστη

  • Να συντελεί στην δημιουργία προτύπου για πειραματισμό της νέας αυτής ιδέας

  • Να προωθεί γενικότερη εξοικείωση με η συγκεκριμένη τεχνολογία και γενικότερα με εφαρμογές Τεχνητής νοημοσύνης

  • Την δημιουργία πειραματικής υποδομής για μελλοντική χρήση τόσο στο σχολείο όσο και αλλού


Β. Δομή - Χρήση- Υλοποίηση του συστήματος


Το σύστημα περιλαμβάνει τα ακόλουθα μέρη:

Βασικά μέρη του συστήματος

Το βασικά μέρη του συστήματος μας περιγράφεται παρακάτω

1. Κεντρικός server του συστήματος

Στο κέντρο του συστήματος θα υπάρχει ο εξυπηρετητής (server) υλοποιημένος σε ένα raspberry pi . Στον server αυτό θα εγκαταστήσουμε ανοικτό λογισμικό το οποίο θα εκτελεί όλες τις διαδικασίες του συστήματος.

Συγκεκριμένα θα μπορεί να :

  • Επικοινωνεί με τους φορητούς ηχητικούς βοηθούς
  • Επικοινωνεί με τις Ελεγχόμενες Συσκευές
  • Ανίχνευση και Επεξεργασία ομιλίας
  • Σύνθεση μηνυμάτων απόκρισης
  • Έλεγχος και εκτέλεση εντολών στις ελεγχόμενες συσκευές
  • Παροχή web interface για τον χρήστη
  • Απεικόνιση μεγεθών αισθητήρων
  • κ.τ.λ

2. Φορητός Ηχητικός Βοηθός

Βασική θέση στο σύστήμα μας , θα έχει ο ηχητικός βοηθός, ο οποίος θα είναι μια συσκευή που θα αναγνωρίζει ομιλία και μετά την κατάλληλη επεξεργασία θα μπορεί να απαντά στον χρήστη εκτελώντας ταυτόχρονα και τις εντολές που αυτός θα του δώσει.

Πιο συγκεκριμένα η συσκευή αυτή θα αποτελείται από :

  • Κατασκευή με τρισδιάστατη εκτύπωση κατάλληλου κουτιού φιλοξενίας
  • Μικρόφωνο και ηχείο για λήψη και αναπαραγωγή ήχου
  • Μικροεπεξεργαστή τοπικού ελέγχου με wi-fi επικοινωνία
  • Streaming της ροής ήχου στον κεντρικό server
  • Rgb leds σε μορφή ταινίας για οπτική ανατροφοδότηση

3.Ελεγχόμενες Συσκευές

Στις ελεγχόμενες συσκευές θα μπορούν να συμπεριληφθούν μερικές εμπορικές συσκευές καθώς και δικές μας ιδιοκατασκευές.

Αναλυτικότερα θα μπορούν να είναι :

  • Πρίζες ελεγχόμενες με επικοινωνία wi-fi
  • Μετρητές κατανάλωσης ενέργειας
  • Φωτιστικά και λεντοταινίες
  • Αισθητήρες θερμοκρασίας και υγρασίας
  • Έξυπνα ηχεία
  • κ.τ.λ

Σημείωση : Στο έργο δεν θα συμπεριλάβουμε όλες τις παραπάνω Ελεγχόμενες Συσκευές, αλλά μόνο θα προδιαγράψουμε τον τρόπο ελέγχου και επικοινωνίας

4.Δικτυακή Υποδομή :

Όπως ήδη αναφέραμε ο κεντρικός σταθμός του συστήματος θα συνδέεται στο τοπικό δίκτυο του σχολείου. Η προσπάθειά μας θα είναι να τοποθετηθεί σε μέρος το οποίο να είναι κοντά σε κάποιο Ethernet network switch έτσι ώστε να μπορεί να συνδεθεί με τους χρήστες . Επίσης δεν έχουμε προδιαγράψει κάποιον πρόσθετο δικτυακό εξοπλισμό έτσι ώστε να κάνουμε ελαχιστοποίηση του κόστους του συστήματος


Κύρια Χαρακτηριστικά


  • Στο Hardware και στο software θα γίνεται χρήση αποκλειστικά ανοιχτών τεχνολογιών και ανοιχτού λογισμικού (Raspberry Pi, ESP32, Python, Home Assistant , Node Red, κτλ)

  • Το όλο σύστημα στα σχεδιαστεί έτσι ώστε να παρέχεται η μέγιστη επεκτασιμότητα και θα ακολουθεί λογική αρθρωτού σχεδιασμoύ.

  • Η αυτοματοποίηση θα μπορεί να επεκταθεί σε οποιοδήποτε αριθμό αισθητήρων και συσκευών

  • Ο κεντρικός σταθμός θα αρχειοθετεί και θα οργανώνει " συνταγές και σενάρια χρήσης" τις οποίες θα ενεργοποιεί και θα αποστέλλει κατά τη βούληση του χειριστή


Υλικά - Λίστα υλικών - Κόστος


Το σύστημα που προτείνεται είναι αρθρωτό και μπορεί να υλοποιηθεί με κλιμακούμενες διαμορφώσεις. Το προϋπολογιζόμενο κόστος είναι 387, στο προτεινόμενο πλήρες σύστημα

ΥΚΙΚΑ

  • 1 τεμ. Χ 3D Νήμα PLA 1.75mm 1kg

  • 2 τεμ. Χ Speaker - 3" Diameter - 4 Ohm , 3 Watt

  • 2 τεμ. Χ Stereo Enclosed Speaker -8 Ohm , 3 W

  • 1 τεμ. Χ Raspberry Pi Zero 2 W kit

  • 1 τεμ. Χ Raspberry Pi 5 8GB kit

  • 1 τεμ. Χ Addressable LED Strip WS2812

  • 2 τεμ. Χ ESP32 Development Board - DEVKIT V1

  • 2 τεμ. Χ I2S MEMS Microphone Breakout

  • 2 τεμ. Χ I2S 3W Class D Amplifier Breakout - MAX98357A

  • 2 τεμ. Χ Πλακέτα Δοκιμών (Breadboard)

  • 2 τεμ. Χ Jumper Cables, Dupont Terminal SET

  • 2 τεμ. Χ Μπαταρία Λιθίου 18650 3.6V - 2600mAh + Μπαταριοθήκη

  • Διάφορα μικροηλεκτρονικά εξαρτήματα

  • Καλώδια,βίδες, κτλ"

Αναλυτικότερα το κόστος και τα υλικά :

κόστος και τα υλικά και μπορεί να βρεθει στο παρακάτω αρχείο Αναλυτικά Υλικά και κόστος Συστήματος


Κατασκευή


Μελλοντικές επεκτάσεις


Κοινωνική επίδραση

Σε βασικές γραμμές , μπορούμε να πούμε ότι οι κυριότερες κοινωνικές επιδράσεις είναι οι παρακάτω:

  • Δημιουργία πνεύματος και κλίματος έρευνας και δημιουργίας

  • Ενίσχυση της χρήσης και αποδοχής ανοιχτών τεχνολογιών (με σκοπό την αντικατάσταση παρόμοιων κλειστών)

  • Κινητοποίηση καινοτομίας και παρόμοιων προτάσεων από την ευρύτερη κοινωνία

  • Ενίσχυση και υποβοήθηση προσωπικών ικανοτήτων και δεξιοτήτων των μαθητών

  • Κινητροδότηση των μαθητών για συμμετοχή σε ομαδικές εργασίες


Σύνδεσμοι - Αναφορές

https://openedtech.ellak.gr/

About

Ψηφιακός ηχητικός βοηθός

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages