DAMO-NLP-SG
/

VideoLLaMA3-7B-Image

Visual Question Answering

videollama3_qwen2

text-generation

large-language-model

video-language-model

Model card Files Files and versions

VideoLLaMA3-7B-Image / preprocessor_config.json

Zesen Cheng

Upload processor

668d25a verified over 1 year ago

history blame contribute delete

596 Bytes

	{
	"auto_map": {
	"AutoImageProcessor": "image_processing_videollama3.Videollama3ImageProcessor",
	"AutoProcessor": "processing_videollama3.Videollama3Qwen2Processor"
	},
	"do_convert_rgb": true,
	"do_normalize": true,
	"do_rescale": true,
	"do_resize": true,
	"image_mean": [
	0.5,
	0.5,
	0.5
	],
	"image_processor_type": "Videollama3ImageProcessor",
	"image_std": [
	0.5,
	0.5,
	0.5
	],
	"max_tokens": 16384,
	"min_tokens": 16,
	"patch_size": 14,
	"processor_class": "Videollama3Qwen2Processor",
	"resample": 3,
	"rescale_factor": 0.00392156862745098
	}