POS Tagging Comparison

Uploaded by

bharathmad30

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

5 views3 pages

POS Tagging Comparison

Uploaded by

bharathmad30

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 3

Part of Speech (POS) Tagging

POS tagging is the process of assigning a part of speech (e.g., noun, verb, adjective)
to each word in a sentence based on its definition and context.

1. Rule-Based POS Tagging

Definition:
Rule-Based POS tagging uses a set of hand-crafted linguistic rules to assign tags to
words.

Process:
Relies on lexical dictionaries (e.g., "run" can be a noun or verb).
Uses rules to resolve ambiguities.
Example rules:
If a word ends in “-ly”, tag as an adverb (RB).
If a word is preceded by a determiner (e.g., “the”) and not a verb, tag as a
noun.

Example:
Sentence: “He can fish.”
“can” → modal verb (MD)
“fish” → verb (VB) based on rule that a modal is followed by a verb.

Strengths:
Linguistically interpretable and explainable.
Effective when the language is well-understood.
No training data required.

Weaknesses:
Difficult and time-consuming to write exhaustive rules.
Not robust to exceptions and ambiguous contexts.
Poor performance in noisy or unseen data.

2. Stochastic (Statistical) POS Tagging

Definition:
Stochastic POS tagging uses probabilities and statistics from a large corpus to
determine the most likely tag for a word in context.

Types:
Unigram Tagger: Uses most frequent tag for each word.
Bigram/Trigram Tagger: Uses previous one or two tags to determine the current
tag.
HMM Tagger: Uses Hidden Markov Models for sequence-based tagging.
Machine Learning Models: Use Naïve Bayes, CRFs, or Neural Networks.

Example:
Sentence: “He can fish.”
The model calculates probabilities:
P(can|PRP) = modal verb (MD)
P(fish|MD) = verb (VB)

Strengths:
Learns from data; adaptable to new patterns.
High accuracy with large, annotated corpora.
Handles ambiguity statistically.

Weaknesses:
Requires large labeled datasets for training.
Less interpretable than rule-based methods.
Performance depends on training corpus quality.

Comparison Table:
Criteria Rule-Based Tagging Stochastic Tagging

Approach Manual rules Probabilistic models

Data Requirement No training data needed Requires annotated

Adaptability Low High

Accuracy (in practice) Moderate High (with sufficient

Interpretability High (transparent rules) Low (black-box for

Example of Ambiguity Hard to resolve all cases Uses probability to

Conclusion:
Rule-based tagging is best for small systems or where rules are well-defined.
Stochastic tagging is more scalable and accurate for large, real-world
applications.

A New Approach To Parts of Speech Tagging in Malayalam
No ratings yet
A New Approach To Parts of Speech Tagging in Malayalam
10 pages
2025 Virtual Assessment Center Guide - Candidate
No ratings yet
2025 Virtual Assessment Center Guide - Candidate
5 pages
Read-Kay and Robb Opposition Materials 07-17-20
No ratings yet
Read-Kay and Robb Opposition Materials 07-17-20
189 pages
NLP Chapter 3
No ratings yet
NLP Chapter 3
36 pages
Hidden Markov Model
No ratings yet
Hidden Markov Model
13 pages
Developing Methods For Part of Speech Tagging in Turkish Language
No ratings yet
Developing Methods For Part of Speech Tagging in Turkish Language
45 pages
(1919) The Friendship of Books: Edited by Scott Temple
No ratings yet
(1919) The Friendship of Books: Edited by Scott Temple
274 pages
NLP Ia2
No ratings yet
NLP Ia2
18 pages
Part-of-Speech (POS) Tagging
No ratings yet
Part-of-Speech (POS) Tagging
94 pages
A Probabilistic Approach To POS Tagging (HMM) - by Arindam Dey - CodeX - Medium
No ratings yet
A Probabilistic Approach To POS Tagging (HMM) - by Arindam Dey - CodeX - Medium
21 pages
NLP 4
No ratings yet
NLP 4
83 pages
Lecture#11 (POS Tagging)
No ratings yet
Lecture#11 (POS Tagging)
19 pages
Regular Expressions Demystified: A Practical Guide with Examples
From Everand
Regular Expressions Demystified: A Practical Guide with Examples
William E. Clark
No ratings yet
Ai TXT Unit4
No ratings yet
Ai TXT Unit4
39 pages
Wadola Habte Seminar
No ratings yet
Wadola Habte Seminar
16 pages
NLP-Lectures 4,5,6
No ratings yet
NLP-Lectures 4,5,6
85 pages
10 - POS Tagging
No ratings yet
10 - POS Tagging
75 pages
Lecture Part of Speech Tagging
No ratings yet
Lecture Part of Speech Tagging
41 pages
JMP for Mixed Models
From Everand
JMP for Mixed Models
Ruth Hummel
No ratings yet
Lecture 20-23 Part of Speech Tagging
No ratings yet
Lecture 20-23 Part of Speech Tagging
36 pages
Pos Tagging
No ratings yet
Pos Tagging
84 pages
Lecture 16-17-18-19
No ratings yet
Lecture 16-17-18-19
42 pages
Unit3 01
No ratings yet
Unit3 01
10 pages
Pos Tagging
No ratings yet
Pos Tagging
84 pages
Unit 3
No ratings yet
Unit 3
50 pages
S1 Chp1 Slides
No ratings yet
S1 Chp1 Slides
8 pages
Module-5 (Markov Model and Pos Tagging)
No ratings yet
Module-5 (Markov Model and Pos Tagging)
66 pages
Electro Fractal Universe - Web Version
100% (1)
Electro Fractal Universe - Web Version
77 pages
Part-of-Speech (POS) Tagging
No ratings yet
Part-of-Speech (POS) Tagging
47 pages
This Is AI4001: GCR: t37g47w
No ratings yet
This Is AI4001: GCR: t37g47w
51 pages
Module 3
No ratings yet
Module 3
33 pages
5 Sequence Learning
No ratings yet
5 Sequence Learning
50 pages
Implementation of The NACE Rev.2 in The French Structural Business Statistics and Data Back-Casting Method
No ratings yet
Implementation of The NACE Rev.2 in The French Structural Business Statistics and Data Back-Casting Method
13 pages
Sanskrit Tag-Sets and Part-Of-Speech Tagging Methods - A Survey
No ratings yet
Sanskrit Tag-Sets and Part-Of-Speech Tagging Methods - A Survey
6 pages
Rule-Based POS Tagging: Part of Speech Tagging
No ratings yet
Rule-Based POS Tagging: Part of Speech Tagging
10 pages
Rule Based POS Tagging Example
No ratings yet
Rule Based POS Tagging Example
4 pages
A Guide To SOA Governance: Executive Summary
No ratings yet
A Guide To SOA Governance: Executive Summary
14 pages
Mathematics Notes and Formula For Class 12 Chapter 4. Determinants
No ratings yet
Mathematics Notes and Formula For Class 12 Chapter 4. Determinants
9 pages
POS Tagging-II
No ratings yet
POS Tagging-II
11 pages
Part of Speech Tagging and Hidden Markov Models
No ratings yet
Part of Speech Tagging and Hidden Markov Models
24 pages
Pos Tagging and Chunking
No ratings yet
Pos Tagging and Chunking
29 pages
Part-Of-Speech (POS) Tagging
No ratings yet
Part-Of-Speech (POS) Tagging
53 pages
Assignment 3
No ratings yet
Assignment 3
12 pages
Shafahath Resume PDF
No ratings yet
Shafahath Resume PDF
7 pages
Sepe A POS Tagger For Spanish
No ratings yet
Sepe A POS Tagger For Spanish
10 pages
Poem Summary
No ratings yet
Poem Summary
6 pages
POStagging
No ratings yet
POStagging
72 pages
Parts of Speech Tagging Using Hidden Markov Model, Maximum Entropy Model and Conditional Random Field
No ratings yet
Parts of Speech Tagging Using Hidden Markov Model, Maximum Entropy Model and Conditional Random Field
28 pages
Improving Punjabi Part of Speech Tagger by Using Reduced Tag Set
No ratings yet
Improving Punjabi Part of Speech Tagger by Using Reduced Tag Set
7 pages
Practitioners' Forum Vi (220025894)
No ratings yet
Practitioners' Forum Vi (220025894)
3 pages
NRECA Water Balance
No ratings yet
NRECA Water Balance
54 pages
Summary Exercise
No ratings yet
Summary Exercise
6 pages
NLPChapter 3
No ratings yet
NLPChapter 3
14 pages
POS Tagging
No ratings yet
POS Tagging
5 pages
Part of Speech Tagger For Marathi Language
No ratings yet
Part of Speech Tagger For Marathi Language
5 pages
October 21 Lesson Plan
No ratings yet
October 21 Lesson Plan
3 pages
A9254058119 PDF
No ratings yet
A9254058119 PDF
10 pages
Explain in Detail Rule Based POS Tagging
No ratings yet
Explain in Detail Rule Based POS Tagging
12 pages
NLP Report - Modified
No ratings yet
NLP Report - Modified
8 pages
Word Class Prediction of Ambiguous and Unknown Words of Punjabi Language Using Bi-Gram Methods
No ratings yet
Word Class Prediction of Ambiguous and Unknown Words of Punjabi Language Using Bi-Gram Methods
5 pages
Unit No 3
No ratings yet
Unit No 3
8 pages
Rutuja
No ratings yet
Rutuja
10 pages
POS Tagging HMM Notes With Diagrams
No ratings yet
POS Tagging HMM Notes With Diagrams
4 pages
A Hybrid Model For POS Tagging
No ratings yet
A Hybrid Model For POS Tagging
4 pages
Lecture Notes On Syntactic Processing
No ratings yet
Lecture Notes On Syntactic Processing
14 pages
2.1 Rule Based POS Tagging
No ratings yet
2.1 Rule Based POS Tagging
5 pages
Sharp Gp2y0a710k0f
No ratings yet
Sharp Gp2y0a710k0f
9 pages
pxc3904245 (Marathi)
No ratings yet
pxc3904245 (Marathi)
4 pages
A Hybrid Model For Part-of-Speech Tagging and Its Application To Bengali
No ratings yet
A Hybrid Model For Part-of-Speech Tagging and Its Application To Bengali
4 pages
PARTS OF SPEECH TAGGING Article
No ratings yet
PARTS OF SPEECH TAGGING Article
4 pages
JP Sauer Sohn Catalogues - Compressors
No ratings yet
JP Sauer Sohn Catalogues - Compressors
12 pages
Tagging and Its Types
No ratings yet
Tagging and Its Types
3 pages
"Green Buildings": "Gaurav Verma" (1021310455)
No ratings yet
"Green Buildings": "Gaurav Verma" (1021310455)
4 pages
COMPUTER STUDIES Grade 7 Assessment TERM 2 EXAM 001 2024
No ratings yet
COMPUTER STUDIES Grade 7 Assessment TERM 2 EXAM 001 2024
5 pages
SLC OPT Math Natural Numbers PDF
No ratings yet
SLC OPT Math Natural Numbers PDF
2 pages
Multi-Tagging For Transition-Based Dependency Parsing
No ratings yet
Multi-Tagging For Transition-Based Dependency Parsing
10 pages
Midpoint Circle Algorithm
No ratings yet
Midpoint Circle Algorithm
13 pages
CBSE10 Math Test-2 10E.B10 2022-23
No ratings yet
CBSE10 Math Test-2 10E.B10 2022-23
4 pages
Pos Tagging of Punjabi Language Using Hidden Markov Model
No ratings yet
Pos Tagging of Punjabi Language Using Hidden Markov Model
9 pages
Mobilux EP 3
No ratings yet
Mobilux EP 3
3 pages
Data Modeling 101
No ratings yet
Data Modeling 101
17 pages
Speech Recognition Architecture
No ratings yet
Speech Recognition Architecture
13 pages
Pib 1789635
No ratings yet
Pib 1789635
3 pages
Maf Toyota
0% (1)
Maf Toyota
2 pages
Gender Discrimination in Mahesh Dattani's Play Tara
No ratings yet
Gender Discrimination in Mahesh Dattani's Play Tara
3 pages
Uvm Preview
No ratings yet
Uvm Preview
26 pages
Modal Prestressed
No ratings yet
Modal Prestressed
5 pages
How Graphology Fools People
No ratings yet
How Graphology Fools People
14 pages
Top Tips For MRCGP CSA Exam P2
No ratings yet
Top Tips For MRCGP CSA Exam P2
3 pages
Pre-K - The Busy Little Squirrel
No ratings yet
Pre-K - The Busy Little Squirrel
6 pages