Το plugin εξαγωγής θεματικών ενοτήτων αναλύει αυτόματα το κείμενο του άρθρου μαζί με τα σχόλια των πολιτών και αναγνωρίζει τις σχετικές θεματικές κατηγορίες από μια προκαθορισμένη ταξινόμηση. Οι ενότητες εμφανίζονται στη δημόσια σελίδα του άρθρου, ώστε οι επισκέπτες να αντιλαμβάνονται με μια ματιά τα κύρια ζητήματα της διαβούλευσης.

Πως λειτουργεί το Topic Modeling;

1. Το plugin ενεργοποιείται αυτόματα κάθε φορά που δημοσιεύεται ή ενημερώνεται ένα άρθρο διαβούλευσης.
2. Συλλέγονται ο τίτλος και το κείμενο του άρθρου. Σε μεταγενέστερη εξέλιξη του εργαλείου, θα υπάρχει δυνατότητα συλλογής των σχολίων που έχουν υποβληθεί από τους πολίτες.
3. Εντοπίζεται αυτόματα η γλώσσα του περιεχομένου (υποστηρίζονται ελληνικά, αγγλικά, γερμανικά) ώστε η ανάλυση και οι ετικέτες των θεμάτων να αντιστοιχούν στη γλώσσα της διαβούλευσης.
4. Με χρήση πολυγλωσσικού μοντέλου embeddings (mpnet) δημιουργείται μια αριθμητική αναπαράσταση του συνολικού περιεχομένου της διαβούλευσης.
5. Η ταξινόμηση του συστήματος περιλαμβάνει περίπου 100 προκαθορισμένα θέματα, οργανωμένα σε γενικές κατηγορίες (parents) και υποκατηγορίες (leaves), επιμελημένα ώστε να καλύπτουν θέματα δημόσιας διαβούλευσης· κάθε ένα διαθέτει τη δική του αριθμητική αναπαράσταση που έχει υπολογιστεί προκαταβολικά.
6. Με χρήση του δείκτη ομοιότητας cosine similarity και κανονικοποίησης των τιμών (z-score normalization) υπολογίζεται πόσο συνδέεται το περιεχόμενο της διαβούλευσης με κάθε θέμα της ταξινόμησης.
7. Διατηρούνται μόνο τα θέματα των οποίων η συνάφεια ξεπερνά ένα προκαθορισμένο κατώφλι, και ομαδοποιούνται κάτω από τη γενική κατηγορία στην οποία ανήκουν.
8. Το αποτέλεσμα αποθηκεύεται μόνιμα στο άρθρο και εμφανίζεται στη δημόσια σελίδα, ακριβώς κάτω από τον τίτλο και πάνω από το κείμενο του άρθρου, σε συμπαγή μορφή «Γενική κατηγορία: υποκατηγορία 1, υποκατηγορία 2», με ένδειξη ότι έχουν παραχθεί αυτόματα (Created with AI).