Javascript must be enabled to continue!

Writer identification

Τα σύγχρονα συστήματα αναγνώρισης γραφέα χρησιμοποιούν μια ποικιλία διαφορετικών χαρακτηριστικών και τεχνικών για να προσδιορίσουν τον συγγραφέα του χειρόγραφου κειμένου. Σε αυτή την διατριβή παρουσιάζονται διάφορα κατευθυντικά χαρακτηριστικά καθώς και συνδυασμοί κατευθυντικών χαρακτηριστικών με χαρακτηριστικά που βασίζονται σε μοντέλα. Συγκεκριμένα, επιχειρούνται αρκετές βελτιώσεις ενός στατιστικού, κατευθυντικού χαρακτηριστικού, του edge hinge distribution. Τα νέα χαρακτηριστικά που παρουσιάζονται είναιτο Skeleton Hinge Distribution, το Weighted Skeleton Hinge Distribution, το Quantized SkeletonHinge Distribution, το Directional Stroke Run Length Distribution και το Edge Skeleton HingeCombination . Επιπλέον, διερευνάται ο συνδυασμός του Skeleton Hinge Distribution με ένα χαρακτηριστικό που βασίζετε σε μοντέλα. Νέες συνεισφορές που σχετίζονται με την προεπεξεργασία των εικόνων εγγράφων αλλα και την εξαγωγή πολύτιμων χαρακτηριστικών του κειμένου. Ειδικότερα, παρουσιάζονται δύο τεχνικές για την εκτίμηση μεγέθους κύριου σώματος (Main Body Size Estimation), το οποίο είναι ένα χαρακτηριστικό του κειμένου με εφαρμογή σε ένα ευρύ φάσμα πεδίων ανάλυσης εικόνων εγγράφου. Η πρώτη μέθοδος μετρά άμεσα το μέγεθος του κύριου σώματος, ενώ η δεύτερη υπολογίζει πρώτα τις βασικές γραμμές (baseline). Και οι δύο προτινόμενοι μεθόδοι δεν απαιτούν τμηματοποίηση (segmentation) . Τα πειραματικά αποτελέσματα παρουσιάζονται σε μια συλλογή χειρόγραφων εγγράφων καθώς και σε μια μικρή συλλογή 10 εικόνων απο πληκτρολογημένα εγγράφα προκειμένου να προκύψουν πιο αντικειμενικά αποτελέσματα. Επιπλέον, παρουσιάζετεμια τεχνική για τον εντοπισμό κειμένου που εκμεταλλεύεται το γεγονός ότι το κείμενο πρέπει να παρουσιάζει κάποια αντίθεση σε σχέση με το υπόβαθρο (background), προκειμένου να διακρίνεται από το ανθρώπινο μάτι. Χρησιμοποιείται μια διαδικασία binarization για τη δημιουργία κατάλληλων εικόνων εγγράφου για την ανίχνευση κειμένου. Στην συνέχεια τα συνδεδεμένα στοιχεία (connected components) της εικόνας εξάγονται και εφαρμόζονται ορισμένοι ευρετικοί κανόνες για τον εντοπισμό περιοχών που περιέχουν κείμενο. Για την αξιολόγηση της παρούσας εργασίας, η συλλογή χειρόγραφων firmaker DB χρησιμοποιήθηκε. Η συγκεκριμένη συλλογή περιλαμβάνει 4 σελίδες χειρόγραφού κειμένου από 250 διαφορετικούς συγγραφείς. Χρησιμοποιήθηκε μια πληθώρα τεχνικών αντιστοίχισης για το Skeleton Hinge Distribution, συμπεριλαμβανομένου του πλησιέστερου γείτονα, k-means, ιεραρχικών συστάδων (hierarchical cluster trees) , knn και support vector machines. Το χαρακτηριστικό Skeleton Hinge Distribution κατάφερε να ανιχνεύσει τον συγγραφέα χειρόγραφου κειμένου με ακρίβεια 90,8%, το Weighted Skeleton Hinge Distribution με ακρίβεια 91,2%, το Quantized Skeleton Hinge Distribution με ακρίβεια 92,4%, το Directional Stroke Run LengthDistribution με ακρίβεια 91,2% και το Edge Skeleton Hinge Combination με ακρίβεια 90,2%.

National Documentation Centre (EKT)

Παρασκευάς Διαμαντάτος

2026

Title: Writer identification

Description:

Σε αυτή την διατριβή παρουσιάζονται διάφορα κατευθυντικά χαρακτηριστικά καθώς και συνδυασμοί κατευθυντικών χαρακτηριστικών με χαρακτηριστικά που βασίζονται σε μοντέλα.

Συγκεκριμένα, επιχειρούνται αρκετές βελτιώσεις ενός στατιστικού, κατευθυντικού χαρακτηριστικού, του edge hinge distribution.

Τα νέα χαρακτηριστικά που παρουσιάζονται είναιτο Skeleton Hinge Distribution, το Weighted Skeleton Hinge Distribution, το Quantized SkeletonHinge Distribution, το Directional Stroke Run Length Distribution και το Edge Skeleton HingeCombination .

Επιπλέον, διερευνάται ο συνδυασμός του Skeleton Hinge Distribution με ένα χαρακτηριστικό που βασίζετε σε μοντέλα.

Νέες συνεισφορές που σχετίζονται με την προεπεξεργασία των εικόνων εγγράφων αλλα και την εξαγωγή πολύτιμων χαρακτηριστικών του κειμένου.

Ειδικότερα, παρουσιάζονται δύο τεχνικές για την εκτίμηση μεγέθους κύριου σώματος (Main Body Size Estimation), το οποίο είναι ένα χαρακτηριστικό του κειμένου με εφαρμογή σε ένα ευρύ φάσμα πεδίων ανάλυσης εικόνων εγγράφου.

Η πρώτη μέθοδος μετρά άμεσα το μέγεθος του κύριου σώματος, ενώ η δεύτερη υπολογίζει πρώτα τις βασικές γραμμές (baseline).

Και οι δύο προτινόμενοι μεθόδοι δεν απαιτούν τμηματοποίηση (segmentation) .

Τα πειραματικά αποτελέσματα παρουσιάζονται σε μια συλλογή χειρόγραφων εγγράφων καθώς και σε μια μικρή συλλογή 10 εικόνων απο πληκτρολογημένα εγγράφα προκειμένου να προκύψουν πιο αντικειμενικά αποτελέσματα.

Επιπλέον, παρουσιάζετεμια τεχνική για τον εντοπισμό κειμένου που εκμεταλλεύεται το γεγονός ότι το κείμενο πρέπει να παρουσιάζει κάποια αντίθεση σε σχέση με το υπόβαθρο (background), προκειμένου να διακρίνεται από το ανθρώπινο μάτι.

Χρησιμοποιείται μια διαδικασία binarization για τη δημιουργία κατάλληλων εικόνων εγγράφου για την ανίχνευση κειμένου.

Στην συνέχεια τα συνδεδεμένα στοιχεία (connected components) της εικόνας εξάγονται και εφαρμόζονται ορισμένοι ευρετικοί κανόνες για τον εντοπισμό περιοχών που περιέχουν κείμενο.

Για την αξιολόγηση της παρούσας εργασίας, η συλλογή χειρόγραφων firmaker DB χρησιμοποιήθηκε.

Η συγκεκριμένη συλλογή περιλαμβάνει 4 σελίδες χειρόγραφού κειμένου από 250 διαφορετικούς συγγραφείς.

Χρησιμοποιήθηκε μια πληθώρα τεχνικών αντιστοίχισης για το Skeleton Hinge Distribution, συμπεριλαμβανομένου του πλησιέστερου γείτονα, k-means, ιεραρχικών συστάδων (hierarchical cluster trees) , knn και support vector machines.

Το χαρακτηριστικό Skeleton Hinge Distribution κατάφερε να ανιχνεύσει τον συγγραφέα χειρόγραφου κειμένου με ακρίβεια 90,8%, το Weighted Skeleton Hinge Distribution με ακρίβεια 91,2%, το Quantized Skeleton Hinge Distribution με ακρίβεια 92,4%, το Directional Stroke Run LengthDistribution με ακρίβεια 91,2% και το Edge Skeleton Hinge Combination με ακρίβεια 90,2%.

Back

Writer identification is a process of determining the authorship of handwritten texts, which is important for applications in forensics, historical document analysis, and biometric...

De-identifying government datasets:

De-identification is a general term for any process of removing the association between a set of identifying data and the data subject. This document describes the use of de-identi...

Kirjanik Valev Uibopuu perekondlik kirjavahetus eksiilis: ühise kirjade ruumi loomine distantsi lühendamise abi

Writer Valev Uibopuu (1913–1997) lived in exile from 1943 to 1991. During the whole exile period he carried on an active correspondence. Especially important was the correspondence...

The Role of Identification Parade in the Criminal Justice System of Pakistan

Identification parade is not a new concept it is used in criminal cases for centuries. Article 22 of Q.S.O 1984 does not define identification parade but introduce identification p...

The Ethnomental Components of F.M. Dostoevsky’s Works

Purpose of the study: The purpose of the study is to identify the originality and ideological functional status of the ethnomental component in the works of F. Dostoevsky. Methods...

"Just the Facts, Ma'am" : Reading For Information

In the last chapter, we looked at how examining pages before actually reading them provides useful advance preparation for young readers at home. Let's look now at the act of readi...

China in the Perception of Fyodor Dostoevsky

The aim of the study is to form a holistic image of China as presented in the artistic and journalistic works of Fyodor Dostoevsky. The article examines the issue of China’s place ...

Handwritten Document Analysis for Automatic Writer Recognition

In this paper, we show that both the writer identification and the writer verification tasks can be carried out using local features such as graphemes extracted from the segmentati...

Email:
Password:

Email:

Writer identification

Related Results