YAML Metadata Warning: empty or missing yaml metadata in repo card (https://huggingface.co/docs/hub/model-cards#model-card-metadata)

Restores punctuation, capitalization, and denormalizes Vietnamese text (converts text numbers to digits, formats dates, etc.).

Usage

from transformers import pipeline

corrector = pipeline("text2text-generation", model="tourmii/vietnamese-punc-cap-denorm-v1")

text = "phát biểu nhậm chức chiều hai mươi tám tháng mười một ông vũ đại thắng cho biết việc được tín nhiệm bầu làm chủ tịch ủy ban nhân dân thành phố"

result = corrector(text, max_length=512)
print(result[0]['generated_text'])

Output: Phát biểu nhậm chức chiều 28/11, ông Vũ Đại Thắng cho biết việc được tín nhiệm bầu làm Chủ tịch UBND thành phố

Features

  • ✅ Punctuation restoration
  • ✅ Proper capitalization
  • ✅ Number denormalization (hai mươi tám → 28)
  • ✅ Date formatting (ngày hai mươi tám tháng mười một → 28/11)
Downloads last month
178
Safetensors
Model size
0.4B params
Tensor type
F32
·
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support