---
license: mit
datasets:
- Mattimax/DATA-AI_Conversation_ITA
- DeepMount00/GPT-4o-ITA-INSTRUCT
- Mattimax/Conversation-ITA
language:
- it
library_name: transformers
tags:
- DAC
- M.INC.
- DATA-AI
- conversational
- chat
pipeline_tag: text-generation
---

[![HuggingFace](https://img.shields.io/badge/HuggingFace-Mattimax-brightgreen)](https://huggingface.co/Mattimax)
[![M.INC](https://img.shields.io/badge/M.INC-Labs-blue)](https://huggingface.co/MINC01)

## ☕ Support my research

[![Buy Me a Coffee](https://img.shields.io/badge/Support-Buy%20Me%20a%20Coffee-FFDD00?style=for-the-badge&logo=buymeacoffee&logoColor=black)](https://www.buymeacoffee.com/marzomattye)

# DACNova – Model Card

![Logo di DACNova](https://huggingface.co/Mattimax/DACNova/resolve/main/DACNova_Logo/DACNova_Logo.png)

**DACNova** è un modello linguistico conversazionale di scala intermedia (~400M parametri) sviluppato da **M.INC. Research** come parte della *Little DAC Collection*.
Il modello è progettato per offrire un equilibrio ottimale tra **coerenza conversazionale, capacità di ragionamento e efficienza computazionale**, rendendolo adatto a contesti edge e sistemi con risorse limitate.

---

## Model Details

* **Nome del modello:** DACNova
* **Tipologia:** Transformer decoder-only autoregressivo
* **Parametri:** ~400M
* **Dominio:** Conversational AI / Instruction Following
* **Obiettivo:** Rispondere a istruzioni e conversazioni multi-turno in maniera coerente e affidabile
* **Architettura:** Decoder-only Transformer con attenzione autoregressiva ottimizzata

---

## Training Data

DACNova è stato addestrato su **dataset proprietari curati da M.INC. Research**, focalizzati su:

* Linguaggio naturale generale
* Conversazioni multi-turno
* Dati strutturati per l’addestramento istruttivo (instruction following)

> Nota: I dettagli completi dei dataset e della pipeline di training non sono pubblici.

---

## Intended Use

* Assistenti conversazionali intelligenti
* Sistemi di Q&A o tutor virtuali
* Applicazioni on-device o edge con vincoli di latenza

---

## Limitations & Biases

* DACNova è un modello di scala intermedia: può avere **limiti su ragionamenti complessi o multi-step** rispetto ai modelli più grandi.
* Può riflettere bias presenti nei dati di addestramento proprietari.
* Non è progettato per uso medico, legale o decisionale critico senza supervisione umana.

---

## Ethical Considerations

* Utilizzo responsabile in applicazioni commerciali o pubbliche.
* Evitare la generazione di contenuti offensivi, illegali o discriminatori.
* La modellazione è destinata esclusivamente a scenari di conversazione e istruzione.

---

## Evaluation

* Coerenza conversazionale su dialoghi multi-turno: elevata
* Ragionamento base (logica e deduzioni semplici): buona
* Efficienza di inferenza: ottimizzata per contesti a risorse limitate

> Risultati preliminari dettagliati nel [whitepaper DACNova](https://github.com/M-INC-01/DACNova/blob/main/M.INC.%20Research%20-%20DACNova.pdf)

---

## Usage

```python
from transformers import AutoModelForCausalLM, AutoTokenizer

tokenizer = AutoTokenizer.from_pretrained("Mattimax/DACNova")
model = AutoModelForCausalLM.from_pretrained("Mattimax/DACNova")

prompt = "Spiegami in breve la differenza tra IA e ML."
inputs = tokenizer(prompt, return_tensors="pt")
outputs = model.generate(**inputs, max_new_tokens=100)
print(tokenizer.decode(outputs[0]))
```

---

## Links & References

* **GitHub Repository:** [DACNova](https://github.com/M-INC-01/DACNova)
* **Little DAC Collection:** [Hugging Face](https://huggingface.co/collections/Mattimax/little-dac-collection)
* **Autore:** [Mattimax](https://huggingface.co/Mattimax)
* **Organizzazione:** [M.INC. Research](https://huggingface.co/MINC01)

---

## License

Distribuito sotto **Licenza MIT**. Per dettagli sull’uso commerciale o accesso completo ai materiali, fare riferimento al repository ufficiale.