--- license: mit datasets: - Mattimax/DATA-AI_Conversation_ITA - DeepMount00/GPT-4o-ITA-INSTRUCT - Mattimax/Conversation-ITA language: - it library_name: transformers tags: - DAC - M.INC. - DATA-AI - conversational - chat pipeline_tag: text-generation --- [![HuggingFace](https://img.shields.io/badge/HuggingFace-Mattimax-brightgreen)](https://huggingface.co/Mattimax) [![M.INC](https://img.shields.io/badge/M.INC-Labs-blue)](https://huggingface.co/MINC01) ## ☕ Support my research [![Buy Me a Coffee](https://img.shields.io/badge/Support-Buy%20Me%20a%20Coffee-FFDD00?style=for-the-badge&logo=buymeacoffee&logoColor=black)](https://www.buymeacoffee.com/marzomattye) # DACNova – Model Card ![Logo di DACNova](https://huggingface.co/Mattimax/DACNova/resolve/main/DACNova_Logo/DACNova_Logo.png) **DACNova** è un modello linguistico conversazionale di scala intermedia (~400M parametri) sviluppato da **M.INC. Research** come parte della *Little DAC Collection*. Il modello è progettato per offrire un equilibrio ottimale tra **coerenza conversazionale, capacità di ragionamento e efficienza computazionale**, rendendolo adatto a contesti edge e sistemi con risorse limitate. --- ## Model Details * **Nome del modello:** DACNova * **Tipologia:** Transformer decoder-only autoregressivo * **Parametri:** ~400M * **Dominio:** Conversational AI / Instruction Following * **Obiettivo:** Rispondere a istruzioni e conversazioni multi-turno in maniera coerente e affidabile * **Architettura:** Decoder-only Transformer con attenzione autoregressiva ottimizzata --- ## Training Data DACNova è stato addestrato su **dataset proprietari curati da M.INC. Research**, focalizzati su: * Linguaggio naturale generale * Conversazioni multi-turno * Dati strutturati per l’addestramento istruttivo (instruction following) > Nota: I dettagli completi dei dataset e della pipeline di training non sono pubblici. --- ## Intended Use * Assistenti conversazionali intelligenti * Sistemi di Q&A o tutor virtuali * Applicazioni on-device o edge con vincoli di latenza --- ## Limitations & Biases * DACNova è un modello di scala intermedia: può avere **limiti su ragionamenti complessi o multi-step** rispetto ai modelli più grandi. * Può riflettere bias presenti nei dati di addestramento proprietari. * Non è progettato per uso medico, legale o decisionale critico senza supervisione umana. --- ## Ethical Considerations * Utilizzo responsabile in applicazioni commerciali o pubbliche. * Evitare la generazione di contenuti offensivi, illegali o discriminatori. * La modellazione è destinata esclusivamente a scenari di conversazione e istruzione. --- ## Evaluation * Coerenza conversazionale su dialoghi multi-turno: elevata * Ragionamento base (logica e deduzioni semplici): buona * Efficienza di inferenza: ottimizzata per contesti a risorse limitate > Risultati preliminari dettagliati nel [whitepaper DACNova](https://github.com/M-INC-01/DACNova/blob/main/M.INC.%20Research%20-%20DACNova.pdf) --- ## Usage ```python from transformers import AutoModelForCausalLM, AutoTokenizer tokenizer = AutoTokenizer.from_pretrained("Mattimax/DACNova") model = AutoModelForCausalLM.from_pretrained("Mattimax/DACNova") prompt = "Spiegami in breve la differenza tra IA e ML." inputs = tokenizer(prompt, return_tensors="pt") outputs = model.generate(**inputs, max_new_tokens=100) print(tokenizer.decode(outputs[0])) ``` --- ## Links & References * **GitHub Repository:** [DACNova](https://github.com/M-INC-01/DACNova) * **Little DAC Collection:** [Hugging Face](https://huggingface.co/collections/Mattimax/little-dac-collection) * **Autore:** [Mattimax](https://huggingface.co/Mattimax) * **Organizzazione:** [M.INC. Research](https://huggingface.co/MINC01) --- ## License Distribuito sotto **Licenza MIT**. Per dettagli sull’uso commerciale o accesso completo ai materiali, fare riferimento al repository ufficiale.