Spaces:

OliverPerrin
/

LexiMind

Running

App Files Files Community

OliverPerrin commited on Nov 13

Commit

c51e8ce

1 Parent(s): 9095ecc

Add LexiMind project files and models

Browse files

Files changed (2) hide show

.gitattributes +33 -2
README.md +14 -67

.gitattributes CHANGED Viewed

@@ -1,4 +1,35 @@
-*.pt filter=lfs diff=lfs merge=lfs -text
 *.bin filter=lfs diff=lfs merge=lfs -text
-models/**/*.pt filter=lfs diff=lfs merge=lfs -text
 *.model filter=lfs diff=lfs merge=lfs -text

+*.7z filter=lfs diff=lfs merge=lfs -text
+*.arrow filter=lfs diff=lfs merge=lfs -text
 *.bin filter=lfs diff=lfs merge=lfs -text
+*.bz2 filter=lfs diff=lfs merge=lfs -text
+*.ckpt filter=lfs diff=lfs merge=lfs -text
+*.ftz filter=lfs diff=lfs merge=lfs -text
+*.gz filter=lfs diff=lfs merge=lfs -text
+*.h5 filter=lfs diff=lfs merge=lfs -text
+*.joblib filter=lfs diff=lfs merge=lfs -text
+*.lfs.* filter=lfs diff=lfs merge=lfs -text
+*.mlmodel filter=lfs diff=lfs merge=lfs -text
 *.model filter=lfs diff=lfs merge=lfs -text
+*.msgpack filter=lfs diff=lfs merge=lfs -text
+*.npy filter=lfs diff=lfs merge=lfs -text
+*.npz filter=lfs diff=lfs merge=lfs -text
+*.onnx filter=lfs diff=lfs merge=lfs -text
+*.ot filter=lfs diff=lfs merge=lfs -text
+*.parquet filter=lfs diff=lfs merge=lfs -text
+*.pb filter=lfs diff=lfs merge=lfs -text
+*.pickle filter=lfs diff=lfs merge=lfs -text
+*.pkl filter=lfs diff=lfs merge=lfs -text
+*.pt filter=lfs diff=lfs merge=lfs -text
+*.pth filter=lfs diff=lfs merge=lfs -text
+*.rar filter=lfs diff=lfs merge=lfs -text
+*.safetensors filter=lfs diff=lfs merge=lfs -text
+saved_model/**/* filter=lfs diff=lfs merge=lfs -text
+*.tar.* filter=lfs diff=lfs merge=lfs -text
+*.tar filter=lfs diff=lfs merge=lfs -text
+*.tflite filter=lfs diff=lfs merge=lfs -text
+*.tgz filter=lfs diff=lfs merge=lfs -text
+*.wasm filter=lfs diff=lfs merge=lfs -text
+*.xz filter=lfs diff=lfs merge=lfs -text
+*.zip filter=lfs diff=lfs merge=lfs -text
+*.zst filter=lfs diff=lfs merge=lfs -text
+*tfevents* filter=lfs diff=lfs merge=lfs -text

README.md CHANGED Viewed

@@ -1,67 +1,14 @@
-# LexiMind (Inference Edition)
-LexiMind now ships as a focused inference sandbox for the custom multitask Transformer found in
-`src/models`. Training, dataset downloaders, and legacy scripts have been removed so it is easy to
-load a checkpoint, run the Streamlit demo, and experiment with summarization, emotion
-classification, and topic cues on your own text.
-## What Stays
-- Transformer encoder/decoder and task heads under `src/models`
-- Unit tests for the model stack (`tests/test_models`)
-- Streamlit UI (`src/ui/streamlit_app.py`) wired to the inference helpers in `src/api/inference`
-## What Changed
-- Hugging Face tokenizers provide all tokenization (see `TextPreprocessor`)
-- Training, dataset downloaders, and CLI scripts have been removed
-- Scikit-learn powers light text normalization (stop-word removal optional)
-- Requirements trimmed to inference-only dependencies
-## Quick Start
-```bash
-git clone https://github.com/OliverPerrin/LexiMind.git
-cd LexiMind
-pip install -r requirements.txt
-# Optional extras via setup.py packaging metadata
-pip install .[web]   # installs streamlit + plotly
-pip install .[api]   # installs fastapi
-pip install .[all]   # installs both groups
-streamlit run src/ui/streamlit_app.py
-```
-Configure the Streamlit app via the sidebar to point at your tokenizer directory and model
-checkpoint (defaults assume `artifacts/hf_tokenizer` and `checkpoints/best.pt`).
-## Minimal Project Map
-```
-src/
-├── api/       # load_models + helpers
-├── data/      # TextPreprocessor using Hugging Face + sklearn
-├── inference/ # thin summarizer facade
-├── models/    # core Transformer architecture (untouched)
-└── ui/        # Streamlit interface
-```
-Everything outside `src/` now holds optional assets such as checkpoints, tokenizer exports, and
-documentation stubs.
-## Loading a Checkpoint Programmatically
-```python
-from src.api.inference import load_models, summarize_text
-models = load_models({
-    "checkpoint_path": "checkpoints/best.pt",
-    "tokenizer_path": "artifacts/hf_tokenizer",
-    "hf_tokenizer_name": "facebook/bart-base",
-})
-summary, _ = summarize_text("Paste any article here.", models=models)
-print(summary)
-```
-## License
-GPL-3.0
-## Author
-Oliver Perrin · [email protected]

+---
+title: LexiMind
+emoji: 📊
+colorFrom: pink
+colorTo: gray
+sdk: gradio
+sdk_version: 5.49.1
+app_file: app.py
+pinned: false
+license: mit
+short_description: Multi-Task Transformer for Document Analysis
+---
+Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference