Διαχωρισμός σε συστοιχίες
- Προϋπόθεση: παρόμοια έγγραφα έχουν παρόμοια λεξικά ιστογράμματα
- Ιεραρχικός διαχωρισμός σε συστοιχίες
- Ξεκινάμε υπολογίζοντας τις ομοίοτητες των εγγράφων ανά δύο
- Διαλέγουμε τα δύο έγγραφα με την μέγιστη ομοιότητα και δημιουργούμε μια συστοιχία
- Συνεχίζουμε συγκρινοντας έγγραφα και συστοιχίες μεταξύ τους
- Επαναληπτικός (ευρετικός) διαχωρισμός σε συστοιχίες
- Ξεκινάμε με κάποιες συστοιχίες
- Συγκρίνουμε κάθε έγγραφο με όλες τις συστοιχίες και αν η ομοιότητα του με κάποια από αυτές ξεπερνάει ένα επιλεγμένο όριο το τοποθετούμε εκεί
- Γρήγορη μέθοδος αλλά με μικρότερη ακρίβεια
- Χρήσεις
- Μετά απο μία αναζήτηση: διαχωρισμός των αποτελεσμάτων σε συστοιχίες με βάση την μεταξύ τους ομοιότητα
- Πριν την αναζήτηση: αναζήτηση σε μια απο τις συστοιχίες με βαση την ομοίοτητα της ερώτησης με τις υπάρχουσες συστοιχίες