Search engine for discovering works of Art, research articles, and books related to Art and Culture
ShareThis
Javascript must be enabled to continue!

Writer identification

View through CrossRef
Τα σύγχρονα συστήματα αναγνώρισης γραφέα χρησιμοποιούν μια ποικιλία διαφορετικών χαρακτηριστικών και τεχνικών για να προσδιορίσουν τον συγγραφέα του χειρόγραφου κειμένου. Σε αυτή την διατριβή παρουσιάζονται διάφορα κατευθυντικά χαρακτηριστικά καθώς και συνδυασμοί κατευθυντικών χαρακτηριστικών με χαρακτηριστικά που βασίζονται σε μοντέλα. Συγκεκριμένα, επιχειρούνται αρκετές βελτιώσεις ενός στατιστικού, κατευθυντικού χαρακτηριστικού, του edge hinge distribution. Τα νέα χαρακτηριστικά που παρουσιάζονται είναιτο Skeleton Hinge Distribution, το Weighted Skeleton Hinge Distribution, το Quantized SkeletonHinge Distribution, το Directional Stroke Run Length Distribution και το Edge Skeleton HingeCombination . Επιπλέον, διερευνάται ο συνδυασμός του Skeleton Hinge Distribution με ένα χαρακτηριστικό που βασίζετε σε μοντέλα. Νέες συνεισφορές που σχετίζονται με την προεπεξεργασία των εικόνων εγγράφων αλλα και την εξαγωγή πολύτιμων χαρακτηριστικών του κειμένου. Ειδικότερα, παρουσιάζονται δύο τεχνικές για την εκτίμηση μεγέθους κύριου σώματος (Main Body Size Estimation), το οποίο είναι ένα χαρακτηριστικό του κειμένου με εφαρμογή σε ένα ευρύ φάσμα πεδίων ανάλυσης εικόνων εγγράφου. Η πρώτη μέθοδος μετρά άμεσα το μέγεθος του κύριου σώματος, ενώ η δεύτερη υπολογίζει πρώτα τις βασικές γραμμές (baseline). Και οι δύο προτινόμενοι μεθόδοι δεν απαιτούν τμηματοποίηση (segmentation) . Τα πειραματικά αποτελέσματα παρουσιάζονται σε μια συλλογή χειρόγραφων εγγράφων καθώς και σε μια μικρή συλλογή 10 εικόνων απο πληκτρολογημένα εγγράφα προκειμένου να προκύψουν πιο αντικειμενικά αποτελέσματα. Επιπλέον, παρουσιάζετεμια τεχνική για τον εντοπισμό κειμένου που εκμεταλλεύεται το γεγονός ότι το κείμενο πρέπει να παρουσιάζει κάποια αντίθεση σε σχέση με το υπόβαθρο (background), προκειμένου να διακρίνεται από το ανθρώπινο μάτι. Χρησιμοποιείται μια διαδικασία binarization για τη δημιουργία κατάλληλων εικόνων εγγράφου για την ανίχνευση κειμένου. Στην συνέχεια τα συνδεδεμένα στοιχεία (connected components) της εικόνας εξάγονται και εφαρμόζονται ορισμένοι ευρετικοί κανόνες για τον εντοπισμό περιοχών που περιέχουν κείμενο. Για την αξιολόγηση της παρούσας εργασίας, η συλλογή χειρόγραφων firmaker DB χρησιμοποιήθηκε. Η συγκεκριμένη συλλογή περιλαμβάνει 4 σελίδες χειρόγραφού κειμένου από 250 διαφορετικούς συγγραφείς. Χρησιμοποιήθηκε μια πληθώρα τεχνικών αντιστοίχισης για το Skeleton Hinge Distribution, συμπεριλαμβανομένου του πλησιέστερου γείτονα, k-means, ιεραρχικών συστάδων (hierarchical cluster trees) , knn και support vector machines. Το χαρακτηριστικό Skeleton Hinge Distribution κατάφερε να ανιχνεύσει τον συγγραφέα χειρόγραφου κειμένου με ακρίβεια 90,8%, το Weighted Skeleton Hinge Distribution με ακρίβεια 91,2%, το Quantized Skeleton Hinge Distribution με ακρίβεια 92,4%, το Directional Stroke Run LengthDistribution με ακρίβεια 91,2% και το Edge Skeleton Hinge Combination με ακρίβεια 90,2%.
National Documentation Centre (EKT)
Title: Writer identification
Description:
Τα σύγχρονα συστήματα αναγνώρισης γραφέα χρησιμοποιούν μια ποικιλία διαφορετικών χαρακτηριστικών και τεχνικών για να προσδιορίσουν τον συγγραφέα του χειρόγραφου κειμένου.
Σε αυτή την διατριβή παρουσιάζονται διάφορα κατευθυντικά χαρακτηριστικά καθώς και συνδυασμοί κατευθυντικών χαρακτηριστικών με χαρακτηριστικά που βασίζονται σε μοντέλα.
Συγκεκριμένα, επιχειρούνται αρκετές βελτιώσεις ενός στατιστικού, κατευθυντικού χαρακτηριστικού, του edge hinge distribution.
Τα νέα χαρακτηριστικά που παρουσιάζονται είναιτο Skeleton Hinge Distribution, το Weighted Skeleton Hinge Distribution, το Quantized SkeletonHinge Distribution, το Directional Stroke Run Length Distribution και το Edge Skeleton HingeCombination .
Επιπλέον, διερευνάται ο συνδυασμός του Skeleton Hinge Distribution με ένα χαρακτηριστικό που βασίζετε σε μοντέλα.
Νέες συνεισφορές που σχετίζονται με την προεπεξεργασία των εικόνων εγγράφων αλλα και την εξαγωγή πολύτιμων χαρακτηριστικών του κειμένου.
Ειδικότερα, παρουσιάζονται δύο τεχνικές για την εκτίμηση μεγέθους κύριου σώματος (Main Body Size Estimation), το οποίο είναι ένα χαρακτηριστικό του κειμένου με εφαρμογή σε ένα ευρύ φάσμα πεδίων ανάλυσης εικόνων εγγράφου.
Η πρώτη μέθοδος μετρά άμεσα το μέγεθος του κύριου σώματος, ενώ η δεύτερη υπολογίζει πρώτα τις βασικές γραμμές (baseline).
Και οι δύο προτινόμενοι μεθόδοι δεν απαιτούν τμηματοποίηση (segmentation) .
Τα πειραματικά αποτελέσματα παρουσιάζονται σε μια συλλογή χειρόγραφων εγγράφων καθώς και σε μια μικρή συλλογή 10 εικόνων απο πληκτρολογημένα εγγράφα προκειμένου να προκύψουν πιο αντικειμενικά αποτελέσματα.
Επιπλέον, παρουσιάζετεμια τεχνική για τον εντοπισμό κειμένου που εκμεταλλεύεται το γεγονός ότι το κείμενο πρέπει να παρουσιάζει κάποια αντίθεση σε σχέση με το υπόβαθρο (background), προκειμένου να διακρίνεται από το ανθρώπινο μάτι.
Χρησιμοποιείται μια διαδικασία binarization για τη δημιουργία κατάλληλων εικόνων εγγράφου για την ανίχνευση κειμένου.
Στην συνέχεια τα συνδεδεμένα στοιχεία (connected components) της εικόνας εξάγονται και εφαρμόζονται ορισμένοι ευρετικοί κανόνες για τον εντοπισμό περιοχών που περιέχουν κείμενο.
Για την αξιολόγηση της παρούσας εργασίας, η συλλογή χειρόγραφων firmaker DB χρησιμοποιήθηκε.
Η συγκεκριμένη συλλογή περιλαμβάνει 4 σελίδες χειρόγραφού κειμένου από 250 διαφορετικούς συγγραφείς.
Χρησιμοποιήθηκε μια πληθώρα τεχνικών αντιστοίχισης για το Skeleton Hinge Distribution, συμπεριλαμβανομένου του πλησιέστερου γείτονα, k-means, ιεραρχικών συστάδων (hierarchical cluster trees) , knn και support vector machines.
Το χαρακτηριστικό Skeleton Hinge Distribution κατάφερε να ανιχνεύσει τον συγγραφέα χειρόγραφου κειμένου με ακρίβεια 90,8%, το Weighted Skeleton Hinge Distribution με ακρίβεια 91,2%, το Quantized Skeleton Hinge Distribution με ακρίβεια 92,4%, το Directional Stroke Run LengthDistribution με ακρίβεια 91,2% και το Edge Skeleton Hinge Combination με ακρίβεια 90,2%.

Related Results

De-identifying government datasets:
De-identifying government datasets:
De-identification is a general term for any process of removing the association between a set of identifying data and the data subject. This document describes the use of de-identi...
Kirjanik Valev Uibopuu perekondlik kirjavahetus eksiilis: ühise kirjade ruumi loomine distantsi lühendamise abi
Kirjanik Valev Uibopuu perekondlik kirjavahetus eksiilis: ühise kirjade ruumi loomine distantsi lühendamise abi
Writer Valev Uibopuu (1913–1997) lived in exile from 1943 to 1991. During the whole exile period he carried on an active correspondence. Especially important was the correspondence...
Closed-loop identification for aircraft flutter model parameters
Closed-loop identification for aircraft flutter model parameters
Purpose The purpose of this paper is to extend the authors’ previous contributions on aircraft flutter model parameters identification. Because closed-loop condition is more widely...
Machine learning techniques for forensic camera model identification and anti-forensic attacks
Machine learning techniques for forensic camera model identification and anti-forensic attacks
The goal of camera model identification is to determine the manufacturer and model of an image's source camera. Camera model identification is an important task in multimedia foren...
The Ethnomental Components of F.M. Dostoevsky’s Works
The Ethnomental Components of F.M. Dostoevsky’s Works
Purpose of the study: The purpose of the study is to identify the originality and ideological functional status of the ethnomental component in the works of F. Dostoevsky. Methods...
Handwritten Document Analysis for Automatic Writer Recognition
Handwritten Document Analysis for Automatic Writer Recognition
In this paper, we show that both the writer identification and the writer verification tasks can be carried out using local features such as graphemes extracted from the segmentati...
Identification methods in mass disasters
Identification methods in mass disasters
Different numbers of people are affected in mass disasters. Identification of the disaster victims is a very important issue. For an accurate identification process, good and fast ...
Relationship between nurses knowledge level and workload about implementation of patient identification
Relationship between nurses knowledge level and workload about implementation of patient identification
Patient safety incidents can originate from patient identification errors. From the preliminary study, it was found that there were 3 cases of patient identification errors in the ...

Back to Top