Wonder-Griffin
/

ZeusMM

Text Generation

text-generation-inference

Model card Files Files and versions

ZeusMM / config.json

Wonder-Griffin's picture

Re-save weights in safetensors

3730acc verified 9 months ago

history blame contribute delete

911 Bytes

	{
	"_name_or_path": "Wonder-Griffin/ZeusMM",
	"architectures": [
	"ZeusForCausalLM"
	],
	"audio_latents": 32,
	"audio_model_name": null,
	"auto_map": {
	"AutoConfig": "Wonder-Griffin/ZeusMM--zeus_mm.ZeusMMConfig",
	"AutoModelForCausalLM": "Wonder-Griffin/ZeusMM--zeus_mm.ZeusForCausalLM"
	},
	"d_audio": 768,
	"d_ff": 2048,
	"d_model": 512,
	"d_retrieval": 768,
	"d_vision": 768,
	"dropout": 0.1,
	"film_hidden": 1024,
	"image_latents": 32,
	"initializer_range": 0.02,
	"is_decoder": true,
	"model_type": "zeusmm",
	"n_heads": 8,
	"n_layers": 6,
	"num_experts": 4,
	"retr_latents": 64,
	"retrieval_model_name": null,
	"rope_role_scales": [
	0.95,
	1.0,
	1.05
	],
	"rope_theta": 10000.0,
	"router_hidden": 256,
	"torch_dtype": "float32",
	"transformers_version": "4.46.2",
	"vision_model_name": null,
	"vocab_size": 50267
	}