YAML Metadata
Warning:
empty or missing yaml metadata in repo card
(https://huggingface.co/docs/hub/model-cards#model-card-metadata)
Restores punctuation, capitalization, and denormalizes Vietnamese text (converts text numbers to digits, formats dates, etc.).
Usage
from transformers import pipeline
corrector = pipeline("text2text-generation", model="tourmii/vietnamese-punc-cap-denorm-v1")
text = "phát biểu nhậm chức chiều hai mươi tám tháng mười một ông vũ đại thắng cho biết việc được tín nhiệm bầu làm chủ tịch ủy ban nhân dân thành phố"
result = corrector(text, max_length=512)
print(result[0]['generated_text'])
Output: Phát biểu nhậm chức chiều 28/11, ông Vũ Đại Thắng cho biết việc được tín nhiệm bầu làm Chủ tịch UBND thành phố
Features
- ✅ Punctuation restoration
- ✅ Proper capitalization
- ✅ Number denormalization (hai mươi tám → 28)
- ✅ Date formatting (ngày hai mươi tám tháng mười một → 28/11)
- Downloads last month
- 178
Inference Providers
NEW
This model isn't deployed by any Inference Provider.
🙋
Ask for provider support