Spaces:

jamtur01
/

MMaDA

Runtime error

App Files Files Community

jamtur01 commited on Jun 21

Commit

9c6594c

verified ·

1 Parent(s): 844c7a9

Upload folder using huggingface_hub

Browse files

This view is limited to 50 files because it contains too many changes. See raw diff

Files changed (50) hide show

.gitattributes +624 -0
.gradio/certificate.pem +31 -0
LICENSE +21 -0
README.md +210 -7
accelerate_configs/1_gpu.yaml +15 -0
accelerate_configs/1_node_8_gpus_deepspeed_zero2.yaml +21 -0
accelerate_configs/1_node_8_gpus_deepspeed_zero3.yaml +24 -0
accelerate_configs/8_node_8_gpus_deepspeed_zero2.yaml +21 -0
app.py +894 -0
assets/WX-mmada-2.jpeg +3 -0
assets/WX-mmada-3.jpeg +3 -0
assets/WX-mmada.jpeg +3 -0
assets/example_compare.png +3 -0
assets/llm.png +0 -0
assets/mmu.png +0 -0
assets/pipeline.png +3 -0
assets/random.png +0 -0
assets/reward_trend.png +0 -0
assets/showcase0.8.gif +3 -0
assets/t2i.png +0 -0
assets/title.png +3 -0
assets/wx-mmada-0613.jpeg +3 -0
configs/mmada_demo.yaml +95 -0
configs/mmada_pretraining_stage1_llada_instruct.yaml +100 -0
configs/mmada_pretraining_stage2_llada_instruct.yaml +109 -0
configs/mmada_pretraining_stage3_llada_instruct.yaml +112 -0
configs/mmada_pretraining_stage3_llada_instruct_512_cot.yaml +123 -0
configs/mmada_pretraining_stage4_llada_instruct.yaml +134 -0
generate.py +131 -0
inference_mmu.py +114 -0
inference_t2i.py +129 -0
lm_chat_validation/description.txt +5 -0
lm_chat_validation/questions.jsonl +11 -0
mmu_validation/Decoupling Visual Encoding.png +3 -0
mmu_validation/ai2d.png +3 -0
mmu_validation/clevr.jpg +0 -0
mmu_validation/docvqa.png +0 -0
mmu_validation/dog.png +0 -0
mmu_validation/geo.jpg +0 -0
mmu_validation/llava1.jpg +3 -0
mmu_validation/llava2.jpg +0 -0
mmu_validation/prompts.jsonl +10 -0
mmu_validation/prompts_with_vqa.json +116 -0
mmu_validation/sofa_under_water.jpg +3 -0
models/__init__.py +3 -0
models/__pycache__/__init__.cpython-311.pyc +0 -0
models/__pycache__/common_modules.cpython-311.pyc +0 -0
models/__pycache__/configuration_llada.cpython-311.pyc +0 -0
models/__pycache__/misc.cpython-311.pyc +0 -0
models/__pycache__/modeling_llada.cpython-311.pyc +0 -0

.gitattributes CHANGED Viewed

@@ -33,3 +33,627 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+assets/WX-mmada-2.jpeg filter=lfs diff=lfs merge=lfs -text
+assets/WX-mmada-3.jpeg filter=lfs diff=lfs merge=lfs -text
+assets/WX-mmada.jpeg filter=lfs diff=lfs merge=lfs -text
+assets/example_compare.png filter=lfs diff=lfs merge=lfs -text
+assets/pipeline.png filter=lfs diff=lfs merge=lfs -text
+assets/showcase0.8.gif filter=lfs diff=lfs merge=lfs -text
+assets/title.png filter=lfs diff=lfs merge=lfs -text
+assets/wx-mmada-0613.jpeg filter=lfs diff=lfs merge=lfs -text
+mmu_validation/Decoupling[[:space:]]Visual[[:space:]]Encoding.png filter=lfs diff=lfs merge=lfs -text
+mmu_validation/ai2d.png filter=lfs diff=lfs merge=lfs -text
+mmu_validation/llava1.jpg filter=lfs diff=lfs merge=lfs -text
+mmu_validation/sofa_under_water.jpg filter=lfs diff=lfs merge=lfs -text
+training/questions.json filter=lfs diff=lfs merge=lfs -text
+venv/bin/ninja filter=lfs diff=lfs merge=lfs -text
+venv/bin/ruff filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/PIL/.dylibs/libbrotlicommon.1.1.0.dylib filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/PIL/.dylibs/libbrotlidec.1.1.0.dylib filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/PIL/.dylibs/libfreetype.6.dylib filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/PIL/.dylibs/libharfbuzz.0.dylib filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/PIL/.dylibs/libjpeg.62.4.0.dylib filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/PIL/.dylibs/liblcms2.2.dylib filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/PIL/.dylibs/liblzma.5.dylib filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/PIL/.dylibs/libopenjp2.2.5.3.dylib filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/PIL/.dylibs/libpng16.16.dylib filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/PIL/.dylibs/libtiff.6.dylib filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/PIL/.dylibs/libwebp.7.dylib filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/PIL/.dylibs/libwebpmux.3.dylib filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/PIL/.dylibs/libxcb.1.1.0.dylib filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/PIL/.dylibs/libz.1.3.1.zlib-ng.dylib filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/PIL/__pycache__/Image.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/PIL/__pycache__/TiffImagePlugin.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/PIL/_imaging.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/PIL/_imagingft.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/__pycache__/typing_extensions.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/accelerate/__pycache__/accelerator.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/accelerate/utils/__pycache__/dataclasses.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/accelerate/utils/__pycache__/modeling.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/aiohttp/_http_parser.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/aiohttp/_http_writer.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/aiohttp/_websocket/reader_c.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/anyio/_backends/__pycache__/_asyncio.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/attr/__pycache__/_make.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/charset_normalizer/md.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/charset_normalizer/md__mypyc.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/click/__pycache__/core.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/cpuinfo/__pycache__/cpuinfo.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/datasets/__pycache__/arrow_dataset.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/datasets/__pycache__/builder.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/datasets/__pycache__/dataset_dict.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/datasets/__pycache__/iterable_dataset.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/datasets/__pycache__/load.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/datasets/__pycache__/table.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/datasets/features/__pycache__/features.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/deepspeed/runtime/__pycache__/engine.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/deepspeed/runtime/zero/__pycache__/partition_parameters.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/deepspeed/runtime/zero/__pycache__/stage3.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/deepspeed/runtime/zero/__pycache__/stage_1_and_2.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/diffusers/loaders/__pycache__/lora_pipeline.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/diffusers/loaders/__pycache__/single_file_utils.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/diffusers/models/__pycache__/attention_processor.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/diffusers/models/__pycache__/embeddings.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/diffusers/models/unets/__pycache__/unet_2d_blocks.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/diffusers/pipelines/__pycache__/pipeline_utils.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/diffusers/pipelines/deprecated/versatile_diffusion/__pycache__/modeling_text_unet.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/diffusers/utils/__pycache__/dummy_torch_and_transformers_objects.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/dill/__pycache__/_dill.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/fairscale/nn/data_parallel/__pycache__/fully_sharded_data_parallel.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/frozenlist/_frozenlist.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/fsspec/__pycache__/spec.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/functorch/_C.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/google/_upb/_message.abi3.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/google/protobuf/__pycache__/descriptor_pb2.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/gradio/__pycache__/blocks.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/gradio/__pycache__/routes.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/gradio/_frontend_code/imageslider/img_01.png filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/gradio/_frontend_code/imageslider/img_02.png filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/gradio/_frontend_code/imageslider/img_03.png filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/gradio/templates/frontend/assets/PlotlyPlot-BIRorb_T.js.map filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/gradio/templates/frontend/static/fonts/Source[[:space:]]Sans[[:space:]]Pro/SourceSansPro-Bold.woff2 filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/gradio/templates/frontend/static/fonts/Source[[:space:]]Sans[[:space:]]Pro/SourceSansPro-Regular.woff2 filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/gradio/templates/frontend/static/img/Duck.glb filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/gradio/templates/node/build/client/_app/immutable/chunks/2.CWSJHAMp.js.br filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/gradio/templates/node/build/client/_app/immutable/chunks/AltairPlot.BVZ9FdNy.js.br filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/gradio/templates/node/build/client/_app/immutable/chunks/Index.BYFpraYw.js.br filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/gradio/templates/node/build/client/_app/immutable/chunks/Index.DFkbfyNu.js.br filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/gradio/templates/node/build/client/_app/immutable/chunks/PlotlyPlot.BUZq7W7Q.js.br filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/gradio/templates/node/build/client/_app/immutable/chunks/cytoscape.esm.C_mCjcvO.js.br filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/gradio/templates/node/build/client/_app/immutable/chunks/hls.CFPBCiRi.js.br filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/gradio/templates/node/build/client/_app/immutable/chunks/index.B4f7kVg_.js.br filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/gradio/templates/node/build/client/_app/immutable/chunks/mermaid.core.LHBCPQoh.js.br filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/gradio/templates/node/build/client/_app/immutable/chunks/vega-embed.module.GWvvoORA.js.br filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/gradio/templates/node/build/client/_app/immutable/chunks/vega-tooltip.module.DwwcB-rx.js.br filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/gradio/templates/node/build/server/chunks/PlotlyPlot-DgUTa5VG.js.map filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/gradio_client/__pycache__/media_data.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/hf_xet/hf_xet.abi3.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/huggingface_hub/__pycache__/hf_api.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/huggingface_hub/inference/__pycache__/_client.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/huggingface_hub/inference/_generated/__pycache__/_async_client.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/idna/__pycache__/idnadata.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/idna/__pycache__/uts46data.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/jinja2/__pycache__/compiler.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/latex2sympy2_extended/gen/antlr4_11_0/__pycache__/PSLexer.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/latex2sympy2_extended/gen/antlr4_11_0/__pycache__/PSParser.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/latex2sympy2_extended/gen/antlr4_13_2/__pycache__/PSLexer.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/latex2sympy2_extended/gen/antlr4_13_2/__pycache__/PSParser.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/latex2sympy2_extended/gen/antlr4_9_3/__pycache__/PSLexer.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/latex2sympy2_extended/gen/antlr4_9_3/__pycache__/PSParser.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/mpmath/__pycache__/function_docs.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/mpmath/tests/__pycache__/test_fp.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/mpmath/tests/__pycache__/test_functions2.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/msgpack/_cmsgpack.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/multidict/_multidict.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/multiprocess/tests/__pycache__/__init__.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/networkx/algorithms/isomorphism/tests/__pycache__/test_vf2pp_helpers.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/networkx/drawing/__pycache__/nx_pylab.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/networkx/drawing/tests/__pycache__/test_pylab.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/networkx/drawing/tests/baseline/test_display_complex.png filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/numpy/_core/__pycache__/_add_newdocs.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/numpy/_core/__pycache__/fromnumeric.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/numpy/_core/_multiarray_tests.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/numpy/_core/_multiarray_umath.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/numpy/_core/_simd.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/numpy/_core/tests/__pycache__/test_datetime.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/numpy/_core/tests/__pycache__/test_dtype.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/numpy/_core/tests/__pycache__/test_multiarray.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/numpy/_core/tests/__pycache__/test_nditer.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/numpy/_core/tests/__pycache__/test_numeric.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/numpy/_core/tests/__pycache__/test_regression.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/numpy/_core/tests/__pycache__/test_stringdtype.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/numpy/_core/tests/__pycache__/test_ufunc.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/numpy/_core/tests/__pycache__/test_umath.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/numpy/distutils/__pycache__/ccompiler_opt.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/numpy/distutils/__pycache__/misc_util.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/numpy/distutils/__pycache__/system_info.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/numpy/f2py/__pycache__/crackfortran.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/numpy/fft/_pocketfft_umath.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/numpy/lib/__pycache__/_function_base_impl.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/numpy/lib/__pycache__/_npyio_impl.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/numpy/lib/tests/__pycache__/test_function_base.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/numpy/lib/tests/__pycache__/test_io.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/numpy/lib/tests/__pycache__/test_nanfunctions.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/numpy/linalg/__pycache__/_linalg.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/numpy/linalg/_umath_linalg.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/numpy/linalg/tests/__pycache__/test_linalg.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/numpy/ma/__pycache__/core.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/numpy/ma/tests/__pycache__/test_core.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/numpy/ma/tests/__pycache__/test_extras.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/numpy/random/_bounded_integers.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/numpy/random/_common.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/numpy/random/_generator.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/numpy/random/_mt19937.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/numpy/random/_pcg64.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/numpy/random/_philox.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/numpy/random/bit_generator.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/numpy/random/mtrand.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/numpy/random/tests/__pycache__/test_generator_mt19937.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/numpy/random/tests/__pycache__/test_random.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/numpy/random/tests/__pycache__/test_randomstate.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/numpy/testing/_private/__pycache__/utils.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/numpy/testing/tests/__pycache__/test_utils.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/numpy/typing/tests/data/pass/__pycache__/random.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/omegaconf/grammar/gen/__pycache__/OmegaConfGrammarParser.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/orjson/orjson.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/_libs/algos.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/_libs/arrays.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/_libs/groupby.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/_libs/hashing.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/_libs/hashtable.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/_libs/index.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/_libs/internals.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/_libs/interval.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/_libs/join.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/_libs/lib.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/_libs/missing.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/_libs/ops.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/_libs/parsers.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/_libs/reshape.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/_libs/sas.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/_libs/sparse.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/_libs/testing.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/_libs/tslib.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/_libs/tslibs/conversion.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/_libs/tslibs/dtypes.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/_libs/tslibs/fields.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/_libs/tslibs/nattype.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/_libs/tslibs/np_datetime.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/_libs/tslibs/offsets.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/_libs/tslibs/parsing.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/_libs/tslibs/period.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/_libs/tslibs/strptime.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/_libs/tslibs/timedeltas.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/_libs/tslibs/timestamps.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/_libs/tslibs/timezones.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/_libs/tslibs/tzconversion.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/_libs/tslibs/vectorized.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/_libs/window/aggregations.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/_libs/window/indexers.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/_libs/writers.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/core/__pycache__/frame.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/core/__pycache__/generic.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/core/__pycache__/indexing.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/core/__pycache__/resample.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/core/__pycache__/series.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/core/arrays/__pycache__/categorical.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/core/arrays/__pycache__/datetimelike.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/core/arrays/arrow/__pycache__/array.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/core/groupby/__pycache__/generic.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/core/groupby/__pycache__/groupby.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/core/indexes/__pycache__/base.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/core/indexes/__pycache__/multi.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/core/internals/__pycache__/blocks.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/core/internals/__pycache__/managers.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/core/reshape/__pycache__/merge.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/core/strings/__pycache__/accessor.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/core/window/__pycache__/rolling.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/io/__pycache__/pytables.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/io/__pycache__/sql.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/io/__pycache__/stata.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/io/formats/__pycache__/style.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/io/formats/__pycache__/style_render.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/tests/__pycache__/test_algos.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/tests/apply/__pycache__/test_frame_apply.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/tests/arithmetic/__pycache__/test_datetime64.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/tests/arithmetic/__pycache__/test_period.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/tests/arithmetic/__pycache__/test_timedelta64.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/tests/computation/__pycache__/test_eval.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/tests/copy_view/__pycache__/test_methods.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/tests/dtypes/__pycache__/test_inference.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/tests/extension/__pycache__/test_arrow.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/tests/frame/__pycache__/test_arithmetic.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/tests/frame/__pycache__/test_constructors.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/tests/frame/__pycache__/test_query_eval.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/tests/frame/__pycache__/test_reductions.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/tests/frame/__pycache__/test_stack_unstack.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/tests/frame/indexing/__pycache__/test_indexing.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/tests/groupby/__pycache__/test_apply.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/tests/groupby/__pycache__/test_categorical.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/tests/groupby/__pycache__/test_groupby.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/tests/groupby/aggregate/__pycache__/test_aggregate.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/tests/groupby/transform/__pycache__/test_transform.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/tests/indexes/__pycache__/test_base.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/tests/indexing/__pycache__/test_loc.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/tests/io/__pycache__/test_sql.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/tests/io/__pycache__/test_stata.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/tests/io/formats/__pycache__/test_format.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/tests/io/formats/style/__pycache__/test_style.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/tests/io/json/__pycache__/test_pandas.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/tests/plotting/__pycache__/test_datetimelike.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/tests/plotting/frame/__pycache__/test_frame.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/tests/reductions/__pycache__/test_reductions.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/tests/resample/__pycache__/test_datetime_index.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/tests/reshape/__pycache__/test_pivot.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/tests/reshape/merge/__pycache__/test_merge.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/tests/series/__pycache__/test_constructors.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/tests/series/indexing/__pycache__/test_setitem.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/tests/tools/__pycache__/test_to_datetime.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pandas/tests/window/__pycache__/test_rolling.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pip/_vendor/__pycache__/typing_extensions.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pip/_vendor/chardet/__pycache__/langrussianmodel.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pip/_vendor/distlib/t64-arm.exe filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pip/_vendor/distlib/t64.exe filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pip/_vendor/distlib/w64-arm.exe filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pip/_vendor/distlib/w64.exe filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pip/_vendor/idna/__pycache__/uts46data.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pip/_vendor/pkg_resources/__pycache__/__init__.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pip/_vendor/pyparsing/__pycache__/core.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pip/_vendor/rich/__pycache__/_emoji_codes.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pip/_vendor/rich/__pycache__/console.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pkg_resources/__pycache__/__init__.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pkg_resources/_vendor/more_itertools/__pycache__/more.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pkg_resources/_vendor/pyparsing/__pycache__/core.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/propcache/_helpers_c.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/psutil/__pycache__/_pslinux.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/psutil/tests/__pycache__/__init__.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/psutil/tests/__pycache__/test_linux.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/psutil/tests/__pycache__/test_process.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pyarrow/_acero.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pyarrow/_azurefs.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pyarrow/_compute.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pyarrow/_csv.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pyarrow/_dataset.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pyarrow/_dataset_orc.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pyarrow/_dataset_parquet.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pyarrow/_dataset_parquet_encryption.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pyarrow/_feather.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pyarrow/_flight.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pyarrow/_fs.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pyarrow/_gcsfs.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pyarrow/_hdfs.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pyarrow/_json.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pyarrow/_orc.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pyarrow/_parquet.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pyarrow/_parquet_encryption.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pyarrow/_pyarrow_cpp_tests.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pyarrow/_s3fs.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pyarrow/_substrait.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pyarrow/lib.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pyarrow/libarrow.2000.dylib filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pyarrow/libarrow_acero.2000.dylib filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pyarrow/libarrow_dataset.2000.dylib filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pyarrow/libarrow_flight.2000.dylib filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pyarrow/libarrow_python.2000.0.0.dylib filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pyarrow/libarrow_python.2000.dylib filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pyarrow/libarrow_python.dylib filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pyarrow/libarrow_python_flight.2000.0.0.dylib filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pyarrow/libarrow_python_flight.2000.dylib filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pyarrow/libarrow_python_flight.dylib filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pyarrow/libarrow_substrait.2000.dylib filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pyarrow/libparquet.2000.dylib filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pyarrow/tests/__pycache__/test_array.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pyarrow/tests/__pycache__/test_compute.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pyarrow/tests/__pycache__/test_convert_builtin.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pyarrow/tests/__pycache__/test_csv.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pyarrow/tests/__pycache__/test_dataset.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pyarrow/tests/__pycache__/test_extension_type.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pyarrow/tests/__pycache__/test_flight.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pyarrow/tests/__pycache__/test_fs.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pyarrow/tests/__pycache__/test_io.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pyarrow/tests/__pycache__/test_pandas.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pyarrow/tests/__pycache__/test_table.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pyarrow/tests/__pycache__/test_types.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pydantic/__pycache__/json_schema.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pydantic/__pycache__/types.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pydantic/_internal/__pycache__/_generate_schema.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pydantic_core/__pycache__/core_schema.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pydantic_core/_pydantic_core.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/pygments/lexers/__pycache__/lisp.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/regex/__pycache__/_regex_core.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/regex/__pycache__/test_regex.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/regex/_regex.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/rich/__pycache__/_emoji_codes.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/rich/__pycache__/console.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/safetensors/_safetensors_rust.abi3.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/setuptools/_vendor/__pycache__/typing_extensions.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/setuptools/_vendor/more_itertools/__pycache__/more.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/setuptools/_vendor/pyparsing/__pycache__/core.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/setuptools/cli-arm64.exe filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/setuptools/command/__pycache__/easy_install.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/setuptools/config/_validate_pyproject/__pycache__/fastjsonschema_validations.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/setuptools/gui-arm64.exe filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/assumptions/tests/__pycache__/test_query.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/combinatorics/__pycache__/perm_groups.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/combinatorics/__pycache__/permutations.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/concrete/tests/__pycache__/test_sums_products.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/core/__pycache__/expr.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/core/__pycache__/function.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/core/__pycache__/numbers.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/core/tests/__pycache__/test_args.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/core/tests/__pycache__/test_arit.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/core/tests/__pycache__/test_expr.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/core/tests/__pycache__/test_function.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/core/tests/__pycache__/test_numbers.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/core/tests/__pycache__/test_relational.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/crypto/__pycache__/crypto.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/diffgeom/__pycache__/diffgeom.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/functions/combinatorial/__pycache__/numbers.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/functions/combinatorial/tests/__pycache__/test_comb_numbers.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/functions/elementary/__pycache__/hyperbolic.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/functions/elementary/__pycache__/trigonometric.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/functions/elementary/tests/__pycache__/test_hyperbolic.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/functions/elementary/tests/__pycache__/test_piecewise.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/functions/elementary/tests/__pycache__/test_trigonometric.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/functions/special/__pycache__/bessel.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/functions/special/__pycache__/error_functions.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/functions/special/tests/__pycache__/test_bessel.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/functions/special/tests/__pycache__/test_error_functions.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/geometry/__pycache__/polygon.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/holonomic/__pycache__/holonomic.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/integrals/__pycache__/laplace.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/integrals/__pycache__/manualintegrate.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/integrals/__pycache__/meijerint.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/integrals/tests/__pycache__/test_integrals.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/integrals/tests/__pycache__/test_manual.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/integrals/tests/__pycache__/test_risch.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/logic/__pycache__/boolalg.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/logic/tests/__pycache__/test_boolalg.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/matrices/__pycache__/common.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/matrices/__pycache__/matrixbase.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/matrices/tests/__pycache__/test_matrices.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/matrices/tests/__pycache__/test_matrixbase.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/ntheory/__pycache__/factor_.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/parsing/autolev/__pycache__/_listener_autolev_antlr.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/parsing/autolev/_antlr/__pycache__/autolevparser.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/parsing/latex/_antlr/__pycache__/latexparser.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/parsing/tests/__pycache__/test_c_parser.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/physics/__pycache__/secondquant.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/physics/biomechanics/tests/__pycache__/test_curve.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/physics/continuum_mechanics/__pycache__/beam.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/physics/control/__pycache__/lti.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/physics/control/tests/__pycache__/test_lti.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/physics/mechanics/tests/__pycache__/test_joint.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/physics/quantum/__pycache__/spin.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/physics/quantum/tests/__pycache__/test_spin.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/physics/tests/__pycache__/test_secondquant.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/plotting/__pycache__/series.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/plotting/tests/__pycache__/test_series.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/polys/__pycache__/compatibility.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/polys/__pycache__/polyclasses.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/polys/__pycache__/polyquinticconst.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/polys/__pycache__/polytools.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/polys/__pycache__/rings.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/polys/benchmarks/__pycache__/bench_solvers.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/polys/domains/tests/__pycache__/test_domains.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/polys/matrices/__pycache__/domainmatrix.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/polys/matrices/tests/__pycache__/test_domainmatrix.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/polys/numberfields/__pycache__/resolvent_lookup.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/polys/tests/__pycache__/test_polytools.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/polys/tests/__pycache__/test_ring_series.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/polys/tests/__pycache__/test_rings.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/printing/__pycache__/latex.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/printing/__pycache__/mathml.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/printing/pretty/__pycache__/pretty.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/printing/pretty/tests/__pycache__/test_pretty.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/printing/tests/__pycache__/test_latex.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/printing/tests/__pycache__/test_mathml.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/printing/tests/__pycache__/test_str.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/series/tests/__pycache__/test_limits.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/sets/__pycache__/sets.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/sets/tests/__pycache__/test_fancysets.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/sets/tests/__pycache__/test_sets.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/simplify/__pycache__/hyperexpand.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/simplify/tests/__pycache__/test_simplify.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/solvers/__pycache__/solvers.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/solvers/__pycache__/solveset.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/solvers/diophantine/__pycache__/diophantine.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/solvers/diophantine/tests/__pycache__/test_diophantine.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/solvers/ode/__pycache__/ode.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/solvers/ode/__pycache__/single.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/solvers/ode/__pycache__/systems.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/solvers/ode/tests/__pycache__/test_ode.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/solvers/ode/tests/__pycache__/test_single.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/solvers/ode/tests/__pycache__/test_systems.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/solvers/tests/__pycache__/test_solvers.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/solvers/tests/__pycache__/test_solveset.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/stats/__pycache__/crv_types.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/stats/__pycache__/stochastic_process_types.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/stats/tests/__pycache__/test_continuous_rv.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/stats/tests/__pycache__/test_stochastic_process.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/tensor/__pycache__/tensor.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/tensor/array/expressions/__pycache__/array_expressions.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/tensor/tests/__pycache__/test_tensor.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/testing/__pycache__/runtests.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/utilities/__pycache__/codegen.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/utilities/__pycache__/iterables.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/utilities/tests/__pycache__/test_lambdify.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/sympy/utilities/tests/__pycache__/test_wester.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/tokenizers/tokenizers.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/tomlkit/__pycache__/items.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/torch/__pycache__/__init__.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/torch/__pycache__/_meta_registrations.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/torch/__pycache__/_tensor_docs.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/torch/__pycache__/_torch_docs.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/torch/__pycache__/overrides.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/torch/_decomp/__pycache__/decompositions.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/torch/_dynamo/__pycache__/guards.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/torch/_dynamo/__pycache__/output_graph.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/torch/_dynamo/__pycache__/symbolic_convert.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/torch/_dynamo/__pycache__/trace_rules.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/torch/_dynamo/__pycache__/utils.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/torch/_dynamo/variables/__pycache__/builder.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/torch/_dynamo/variables/__pycache__/builtin.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/torch/_dynamo/variables/__pycache__/functions.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/torch/_dynamo/variables/__pycache__/higher_order_ops.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/torch/_export/serde/__pycache__/serialize.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/torch/_functorch/__pycache__/partitioners.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/torch/_inductor/__pycache__/codecache.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/torch/_inductor/__pycache__/compile_fx.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/torch/_inductor/__pycache__/cudagraph_trees.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/torch/_inductor/__pycache__/graph.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/torch/_inductor/__pycache__/ir.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/torch/_inductor/__pycache__/lowering.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/torch/_inductor/__pycache__/pattern_matcher.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/torch/_inductor/__pycache__/scheduler.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/torch/_inductor/__pycache__/select_algorithm.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/torch/_inductor/__pycache__/utils.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/torch/_inductor/codegen/__pycache__/common.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/torch/_inductor/codegen/__pycache__/cpp.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/torch/_inductor/codegen/__pycache__/cpp_wrapper_cpu.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/torch/_inductor/codegen/__pycache__/halide.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/torch/_inductor/codegen/__pycache__/simd.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/torch/_inductor/codegen/__pycache__/triton.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/torch/_inductor/codegen/__pycache__/wrapper.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/torch/_inductor/fx_passes/__pycache__/quantization.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/torch/_inductor/fx_passes/__pycache__/split_cat.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/torch/_inductor/kernel/__pycache__/flex_attention.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/torch/_inductor/runtime/__pycache__/triton_heuristics.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/torch/_refs/__pycache__/__init__.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/torch/_subclasses/__pycache__/fake_tensor.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/torch/autograd/__pycache__/gradcheck.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/torch/backends/_nnapi/__pycache__/serializer.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/torch/bin/protoc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/torch/bin/protoc-3.13.0.0 filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/torch/distributed/__pycache__/distributed_c10d.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/torch/distributed/fsdp/__pycache__/_flat_param.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/torch/distributed/fsdp/__pycache__/fully_sharded_data_parallel.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/torch/distributed/pipelining/__pycache__/schedules.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/torch/fx/experimental/__pycache__/proxy_tensor.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/torch/fx/experimental/__pycache__/symbolic_shapes.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/torch/lib/libc10.dylib filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/torch/lib/libomp.dylib filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/torch/lib/libtorch_cpu.dylib filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/torch/lib/libtorch_python.dylib filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/torch/linalg/__pycache__/__init__.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/torch/nested/_internal/__pycache__/ops.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/torch/nn/__pycache__/functional.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/torch/nn/modules/__pycache__/loss.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/torch/nn/modules/__pycache__/module.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/torch/nn/parallel/__pycache__/distributed.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/torch/onnx/__pycache__/symbolic_helper.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/torch/onnx/__pycache__/symbolic_opset9.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/torch/optim/__pycache__/lr_scheduler.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/torch/sparse/__pycache__/_triton_ops_meta.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/torch/testing/_internal/__pycache__/common_methods_invocations.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/torch/testing/_internal/__pycache__/common_modules.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/torch/testing/_internal/__pycache__/common_nn.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/torch/testing/_internal/__pycache__/common_quantization.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/torch/testing/_internal/__pycache__/common_utils.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/torch/testing/_internal/distributed/__pycache__/distributed_test.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/torch/testing/_internal/distributed/rpc/__pycache__/dist_autograd_test.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/torch/testing/_internal/distributed/rpc/__pycache__/rpc_test.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/torch/testing/_internal/generated/__pycache__/annotated_fn_args.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/torch/testing/_internal/opinfo/__pycache__/core.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/torch/utils/__pycache__/cpp_extension.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/torch/utils/hipify/__pycache__/cuda_to_hip_mappings.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/torchgen/__pycache__/gen.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/torchgen/__pycache__/model.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/torchvision/.dylibs/libc++.1.0.dylib filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/torchvision/.dylibs/libjpeg.8.2.2.dylib filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/torchvision/.dylibs/libpng16.16.dylib filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/torchvision/.dylibs/libwebp.7.1.8.dylib filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/torchvision/.dylibs/libz.1.2.13.dylib filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/torchvision/_C.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/torchvision/image.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/torchvision/transforms/__pycache__/transforms.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/torchvision/transforms/v2/functional/__pycache__/_geometry.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/transformers/__pycache__/__init__.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/transformers/__pycache__/cache_utils.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/transformers/__pycache__/modeling_outputs.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/transformers/__pycache__/modeling_tf_utils.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/transformers/__pycache__/modeling_utils.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/transformers/__pycache__/testing_utils.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/transformers/__pycache__/tokenization_utils_base.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/transformers/__pycache__/trainer.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/transformers/__pycache__/training_args.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/transformers/generation/__pycache__/logits_process.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/transformers/generation/__pycache__/tf_utils.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/transformers/generation/__pycache__/utils.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/transformers/integrations/__pycache__/integration_utils.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/transformers/models/autoformer/__pycache__/modeling_autoformer.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/transformers/models/bart/__pycache__/modeling_bart.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/transformers/models/bert/__pycache__/modeling_tf_bert.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/transformers/models/big_bird/__pycache__/modeling_big_bird.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/transformers/models/big_bird/__pycache__/modeling_flax_big_bird.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/transformers/models/bigbird_pegasus/__pycache__/modeling_bigbird_pegasus.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/transformers/models/blip_2/__pycache__/modeling_blip_2.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/transformers/models/bridgetower/__pycache__/modeling_bridgetower.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/transformers/models/clap/__pycache__/modeling_clap.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/transformers/models/clvp/__pycache__/modeling_clvp.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/transformers/models/conditional_detr/__pycache__/modeling_conditional_detr.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/transformers/models/deberta_v2/__pycache__/modeling_tf_deberta_v2.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/transformers/models/deformable_detr/__pycache__/modeling_deformable_detr.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/transformers/models/deprecated/deta/__pycache__/modeling_deta.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/transformers/models/deprecated/jukebox/__pycache__/modeling_jukebox.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/transformers/models/deprecated/mega/__pycache__/modeling_mega.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/transformers/models/deprecated/xlm_prophetnet/__pycache__/modeling_xlm_prophetnet.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/transformers/models/detr/__pycache__/image_processing_detr.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/transformers/models/esm/__pycache__/modeling_esmfold.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/transformers/models/flava/__pycache__/modeling_flava.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/transformers/models/grounding_dino/__pycache__/modeling_grounding_dino.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/transformers/models/groupvit/__pycache__/modeling_tf_groupvit.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/transformers/models/informer/__pycache__/modeling_informer.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/transformers/models/kosmos2/__pycache__/modeling_kosmos2.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/transformers/models/led/__pycache__/modeling_led.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/transformers/models/led/__pycache__/modeling_tf_led.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/transformers/models/longformer/__pycache__/modeling_longformer.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/transformers/models/longformer/__pycache__/modeling_tf_longformer.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/transformers/models/longt5/__pycache__/modeling_flax_longt5.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/transformers/models/longt5/__pycache__/modeling_longt5.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/transformers/models/luke/__pycache__/modeling_luke.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/transformers/models/mask2former/__pycache__/modeling_mask2former.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/transformers/models/maskformer/__pycache__/modeling_maskformer.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/transformers/models/mbart/__pycache__/modeling_mbart.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/transformers/models/mllama/__pycache__/modeling_mllama.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/transformers/models/mobilebert/__pycache__/modeling_tf_mobilebert.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/transformers/models/moshi/__pycache__/modeling_moshi.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/transformers/models/mt5/__pycache__/modeling_mt5.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/transformers/models/musicgen/__pycache__/modeling_musicgen.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/transformers/models/musicgen_melody/__pycache__/modeling_musicgen_melody.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/transformers/models/omdet_turbo/__pycache__/modeling_omdet_turbo.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/transformers/models/oneformer/__pycache__/modeling_oneformer.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/transformers/models/patchtsmixer/__pycache__/modeling_patchtsmixer.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/transformers/models/patchtst/__pycache__/modeling_patchtst.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/transformers/models/perceiver/__pycache__/modeling_perceiver.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/transformers/models/prophetnet/__pycache__/modeling_prophetnet.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/transformers/models/qwen2_vl/__pycache__/modeling_qwen2_vl.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/transformers/models/reformer/__pycache__/modeling_reformer.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/transformers/models/rt_detr/__pycache__/modeling_rt_detr.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/transformers/models/seamless_m4t/__pycache__/modeling_seamless_m4t.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/transformers/models/seamless_m4t_v2/__pycache__/modeling_seamless_m4t_v2.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/transformers/models/speecht5/__pycache__/modeling_speecht5.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/transformers/models/t5/__pycache__/modeling_t5.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/transformers/models/tapas/__pycache__/modeling_tapas.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/transformers/models/tapas/__pycache__/modeling_tf_tapas.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/transformers/models/tapas/__pycache__/tokenization_tapas.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/transformers/models/udop/__pycache__/modeling_udop.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/transformers/models/unispeech_sat/__pycache__/modeling_unispeech_sat.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/transformers/models/wav2vec2/__pycache__/modeling_tf_wav2vec2.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/transformers/models/wav2vec2/__pycache__/modeling_wav2vec2.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/transformers/models/wav2vec2_conformer/__pycache__/modeling_wav2vec2_conformer.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/transformers/models/whisper/__pycache__/modeling_whisper.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/transformers/models/xlnet/__pycache__/modeling_xlnet.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/transformers/utils/__pycache__/dummy_pt_objects.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/transformers/utils/__pycache__/dummy_tf_objects.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/wandb/bin/gpu_stats filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/wandb/bin/wandb-core filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/wandb/cli/__pycache__/cli.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/wandb/sdk/__pycache__/wandb_run.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/wandb/sdk/artifacts/__pycache__/artifact.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/wandb/sdk/internal/__pycache__/internal_api.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/wandb/vendor/pygments/lexers/__pycache__/lisp.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/wandb/vendor/pynvml/__pycache__/pynvml.cpython-311.pyc filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/xxhash/_xxhash.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/yaml/_yaml.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text
+venv/lib/python3.11/site-packages/yarl/_quoting_c.cpython-311-darwin.so filter=lfs diff=lfs merge=lfs -text

.gradio/certificate.pem ADDED Viewed

	@@ -0,0 +1,31 @@

+-----BEGIN CERTIFICATE-----
+MIIFazCCA1OgAwIBAgIRAIIQz7DSQONZRGPgu2OCiwAwDQYJKoZIhvcNAQELBQAw
+TzELMAkGA1UEBhMCVVMxKTAnBgNVBAoTIEludGVybmV0IFNlY3VyaXR5IFJlc2Vh
+cmNoIEdyb3VwMRUwEwYDVQQDEwxJU1JHIFJvb3QgWDEwHhcNMTUwNjA0MTEwNDM4
+WhcNMzUwNjA0MTEwNDM4WjBPMQswCQYDVQQGEwJVUzEpMCcGA1UEChMgSW50ZXJu
+ZXQgU2VjdXJpdHkgUmVzZWFyY2ggR3JvdXAxFTATBgNVBAMTDElTUkcgUm9vdCBY
+MTCCAiIwDQYJKoZIhvcNAQEBBQADggIPADCCAgoCggIBAK3oJHP0FDfzm54rVygc
+h77ct984kIxuPOZXoHj3dcKi/vVqbvYATyjb3miGbESTtrFj/RQSa78f0uoxmyF+
+0TM8ukj13Xnfs7j/EvEhmkvBioZxaUpmZmyPfjxwv60pIgbz5MDmgK7iS4+3mX6U
+A5/TR5d8mUgjU+g4rk8Kb4Mu0UlXjIB0ttov0DiNewNwIRt18jA8+o+u3dpjq+sW
+T8KOEUt+zwvo/7V3LvSye0rgTBIlDHCNAymg4VMk7BPZ7hm/ELNKjD+Jo2FR3qyH
+B5T0Y3HsLuJvW5iB4YlcNHlsdu87kGJ55tukmi8mxdAQ4Q7e2RCOFvu396j3x+UC
+B5iPNgiV5+I3lg02dZ77DnKxHZu8A/lJBdiB3QW0KtZB6awBdpUKD9jf1b0SHzUv
+KBds0pjBqAlkd25HN7rOrFleaJ1/ctaJxQZBKT5ZPt0m9STJEadao0xAH0ahmbWn
+OlFuhjuefXKnEgV4We0+UXgVCwOPjdAvBbI+e0ocS3MFEvzG6uBQE3xDk3SzynTn
+jh8BCNAw1FtxNrQHusEwMFxIt4I7mKZ9YIqioymCzLq9gwQbooMDQaHWBfEbwrbw
+qHyGO0aoSCqI3Haadr8faqU9GY/rOPNk3sgrDQoo//fb4hVC1CLQJ13hef4Y53CI
+rU7m2Ys6xt0nUW7/vGT1M0NPAgMBAAGjQjBAMA4GA1UdDwEB/wQEAwIBBjAPBgNV
+HRMBAf8EBTADAQH/MB0GA1UdDgQWBBR5tFnme7bl5AFzgAiIyBpY9umbbjANBgkq
+hkiG9w0BAQsFAAOCAgEAVR9YqbyyqFDQDLHYGmkgJykIrGF1XIpu+ILlaS/V9lZL
+ubhzEFnTIZd+50xx+7LSYK05qAvqFyFWhfFQDlnrzuBZ6brJFe+GnY+EgPbk6ZGQ
+3BebYhtF8GaV0nxvwuo77x/Py9auJ/GpsMiu/X1+mvoiBOv/2X/qkSsisRcOj/KK
+NFtY2PwByVS5uCbMiogziUwthDyC3+6WVwW6LLv3xLfHTjuCvjHIInNzktHCgKQ5
+ORAzI4JMPJ+GslWYHb4phowim57iaztXOoJwTdwJx4nLCgdNbOhdjsnvzqvHu7Ur
+TkXWStAmzOVyyghqpZXjFaH3pO3JLF+l+/+sKAIuvtd7u+Nxe5AW0wdeRlN8NwdC
+jNPElpzVmbUq4JUagEiuTDkHzsxHpFKVK7q4+63SM1N95R1NbdWhscdCb+ZAJzVc
+oyi3B43njTOQ5yOf+1CceWxG1bQVs5ZufpsMljq4Ui0/1lvh+wjChP4kqKOJ2qxq
+4RgqsahDYVvTH9w7jXbyLeiNdd8XM2w9U/t7y0Ff/9yi0GE44Za4rF2LN9d11TPA
+mRGunUHBcnWEvgJBQl9nJEiU0Zsnvgc/ubhPgXRR4Xq37Z0j4r7g1SgEEzwxA57d
+emyPxgcYxn/eR44/KJ4EBs+lVDR3veyJm+kXQ99b21/+jh5Xos1AnX5iItreGCc=
+-----END CERTIFICATE-----

LICENSE ADDED Viewed

	@@ -0,0 +1,21 @@

+MIT License
+Copyright (c) 2025 Ling Yang
+Permission is hereby granted, free of charge, to any person obtaining a copy
+of this software and associated documentation files (the "Software"), to deal
+in the Software without restriction, including without limitation the rights
+to use, copy, modify, merge, publish, distribute, sublicense, and/or sell
+copies of the Software, and to permit persons to whom the Software is
+furnished to do so, subject to the following conditions:
+The above copyright notice and this permission notice shall be included in all
+copies or substantial portions of the Software.
+THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
+IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
+FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL THE
+AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
+LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM,
+OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE
+SOFTWARE.

README.md CHANGED Viewed

@@ -1,12 +1,215 @@
 ---
 title: MMaDA
-emoji: 📊
-colorFrom: green
-colorTo: indigo
-sdk: gradio
-sdk_version: 5.34.2
 app_file: app.py
-pinned: false
 ---
-Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference

 ---
 title: MMaDA
 app_file: app.py
+sdk: gradio
+sdk_version: 3.41.2
 ---
+<div align="center">
+<br>
+<img src="assets/title.png" width="166">
+<h3>Multimodal Large Diffusion Language Models</h3></div>
+<p align="center">
+  <a href="https://arxiv.org/abs/2505.15809">
+    <img
+      src="https://img.shields.io/badge/MMaDA-Paper-red?logo=arxiv&logoColor=red"
+      alt="MMaDA Paper on arXiv"
+    />
+  </a>
+  <a href="https://huggingface.co/spaces/Gen-Verse/MMaDA">
+    <img
+        src="https://img.shields.io/badge/MMaDA%20Demo-Hugging%20Face%20Space-blue?logo=huggingface&logoColor=blue"
+        alt="MMaDA on Hugging Face"
+    />
+  </a>
+  <a href="https://huggingface.co/Gen-Verse/MMaDA-8B-Base">
+    <img
+        src="https://img.shields.io/badge/MMaDA--8B--Base-Hugging%20Face%20Model-orange?logo=huggingface&logoColor=yellow"
+        alt="MMaDA on Hugging Face"
+    />
+  </a>
+    <a href="https://huggingface.co/Gen-Verse/MMaDA-8B-MixCoT">
+    <img
+        src="https://img.shields.io/badge/MMaDA--8B--MixCoT-Hugging%20Face%20Model-orange?logo=huggingface&logoColor=yellow"
+        alt="MMaDA on Hugging Face"
+    />
+  </a>
+  <a href="https://github.com/Gen-Verse/MMaDA/blob/main/assets/wx-mmada-0613.jpeg">
+    <img
+        src="https://img.shields.io/badge/Wechat-Join-green?logo=wechat&amp"
+        alt="Wechat Group Link"
+    />
+  </a>
+</p>
+## 🌌 Introduction
+MMaDA is a new family of **multimodal diffusion foundation models** designed to achieve superior performance across diverse domains such as textual reasoning, multimodal understanding, and text-to-image generation. MMaDA is distinguished by three key innovations:
+1. MMaDA adopts a **unified diffusion architecture** with a shared probabilistic formulation and a modality-agnostic design, eliminating the need for modality-specific components.
+2. MMaDA introduces a **mixed long chain-of-thought (CoT) fine-tuning** strategy that curates a unified CoT format across modalities.
+3. MMaDA adopts a unified policy-gradient-based RL algorithm, which we call **UniGRPO**, tailored for diffusion foundation models. Utilizing diversified reward modeling, **UniGRPO** unifies post-training across both reasoning and generation tasks, ensuring consistent performance improvements.
+<div align="center" style="width: 600px; margin: auto;">
+  <img src="assets/showcase0.8.gif" alt="MMaDA decoding demo" width="550" />
+  <p style="font-style: italic; font-size: 14px; color: #555; margin-top: 6px;">
+    MMaDA's decoding demo. This video showcases how a diffusion foundation model generates text and image.<br>
+    The "Text Generation" part uses a semi-autoregressive sampling method, while the "Multimodal Generation" part adopts non-autoregressive diffusion denoising.
+  </p>
+</div>
+<!--
+## Decoding Demo
+We demonstrate the decoding process of MMaDA with a teaser video to show how a diffusion model generates text and image. The "Text Generation" part adopts a "semi-autoregressive" sampling method and the "MultiModal Generation" part adopts a non-autoregressive sampling method which is purely diffusion denoising.
+<!-- <div style="display: flex; justify-content: center; flex-wrap: wrap;">
+    <img src="assets/showcase0.8.gif" style="width: 90%" />
+</div> -->
+## 📰 Latest Updates
+* **[2025-06-02]** We open source our **MMaDA-8B-MixCoT** at [Huggingface](https://huggingface.co/Gen-Verse/MMaDA-8B-MixCoT).
+* **[2025-05-24]** We add support for MPS inference, tested on M4.
+* **[2025-05-22]** We release the inference and training code of MMaDA for text generation, multimodal generation and image generation.
+* **[2025-05-22]** We open source our **MMaDA-8B-Base** at [Huggingface](https://huggingface.co/Gen-Verse/MMaDA-8B-Base). **MMaDA-8B-MixCoT** and  **MMaDA-8B-Max** will be released in the near future.
+* **[2025-05-22]** We release our [research paper](https://arxiv.org/abs/2505.15809) and [demo](https://huggingface.co/spaces/Gen-Verse/MMaDA) for the first unified multimodal diffusion model: MMaDA.
+## 🧬 MMaDA Series Overview
+MMaDA includes a series of checkpoints reflecting different training stages:
+1. **[MMaDA-8B-Base](https://huggingface.co/Gen-Verse/MMaDA-8B-Base)**: After pretraining and instruction tuning. Capable of basic text generation, image generation, image captioning and **thinking ablities**.
+2. **[MMaDA-8B-MixCoT](https://huggingface.co/Gen-Verse/MMaDA-8B-MixCoT)**: After mixed long chain-of-thought (CoT) fine-tuning. Capable of **complex** textual, multimodal and image generation reasoning.
+3. **MMaDA-8B-Max (coming soon)**: After UniGRPO reinforment learning. Excels at complex reasoning and awesome visual generation. Will be released in the future.
+<div align="center">
+<img src="assets/example_compare.png" width="800">
+<p><i>Overview of MMaDA's capablities.</i></p>
+</div>
+## ✅ TODO
+- [x] Release [MMaDA-8B-MixCoT](https://huggingface.co/Gen-Verse/MMaDA-8B-MixCoT)
+- [ ] Release MMaDA-8B-Max and OpenRLHF-based UniGRPO training code.
+## ⚙️ Quick Start
+First, set up the enviroment:
+```
+pip install -r requirements.txt
+```
+Launch local Gradio demo:
+```
+python app.py
+```
+Or try it online via our [Huggingface Demo](https://huggingface.co/spaces/Gen-Verse/MMaDA).
+## 🚀 Inference
+For batch-level inference, we provide our inference scripts here.
+### 1. Text Generation
+For text generation, we follow LLaDA's configuration and generation script. Simple run:
+```bash
+python generate.py
+```
+### 2. MultiModal Generation
+For multimodal generation and text-to-image generation, first login your wandb account:
+```
+wandb login
+```
+Inference demo for MultiModal Generation and you can view the results on wandb:
+```
+python3 inference_mmu.py config=configs/mmada_demo.yaml mmu_image_root=./mmu_validation question='Please describe this image in detail.'
+```
+### 3. Text-to-Image Genertion
+For multimodal generation and text-to-image generation, first login your wandb account:
+```
+wandb login
+```
+Inference demo for Text-to-Image Genertion and you can view the results on wandb:
+```
+python3 inference_t2i.py config=configs/mmada_demo.yaml batch_size=1 validation_prompts_file=validation_prompts/text2image_prompts.txt guidance_scale=3.5 generation_timesteps=15
+mode='t2i'
+```
+## 🔧 Training
+**Update your training data path in `configs/xx.yaml`.**
+### Stage 0. Prepare your accelerate configs
+Please first prepare your accelerate configs. You can simple run
+```
+accelerate config
+```
+Or use our provided configs in `accelerate_configs`:
+```
+├── accelerate_configs/
+|   ├── 1_gpu.yaml
+|   └── 8_node_8_gpus_deepspeed_zero2.yaml (for 8 * 8 gpus)
+```
+### Stage 1.1: Pre-training on ImageNet
+First we use LLaDA-8B-Instruct to initialize our model, and train on ImageNet for basic visual capbalities.
+```
+accelerate launch --config_file path/to/your/accelerate_config --main_process_port=8888 training/train_mmada.py config=configs/mmada_pretraining_stage1_llada_instruct.yaml
+```
+### Stage 1.2 Pre-training on Image-Text Dataset
+Then we replace the ImageNet dataset in Stage 1.1 with Image-Text Dataset. Please change the pretrained model path in `mmada_pretraining_stage2_llada_instruct.yaml` with your checkpoint in Stage 1.1
+```
+accelerate launch --config_file path/to/your/accelerate_config --main_process_port=8888 training/train_mmada_stage2.py config=configs/mmada_pretraining_stage2_llada_instruct.yaml
+```
+### Stage 1.3 Pre-training on Text Instruction following
+In this stage, we begin training on text instruction following and include corresponding validations. Please change the pretrained model path in `mmada_pretraining_stage3_llada_instruct.yaml` with your checkpoint in Stage 1.2
+```
+accelerate launch --config_file path/to/your/accelerate_config --main_process_port=8888 training/train_mmada_stage3.py config=configs/mmada_pretraining_stage3_llada_instruct.yaml
+```
+### Stage 2.1 Mix-CoT Training (Text Only)
+In this stage, we begin our Mix-CoT finetuning with text reasoning first, along with improved image quality. Please change the pretrained model path in `mmada_pretraining_stage3_llada_instruct.yaml` with your checkpoint in Stage 1.3 and prepare your CoT data.
+```
+accelerate launch --config_file path/to/your/accelerate_config --main_process_port=8888 training/train_mmada_stage_cot_sft.py config=configs/mmada_pretraining_stage3_llada_instruct_512_cot.yaml
+```
+### Stage 2.2 Mix-CoT Training (with MultiModal Reasoning)
+In this stage, we include multimodal reasoning, along with improved image quality. Please change the pretrained model path in `mmada_pretraining_stage3_llada_instruct.yaml` with your checkpoint in Stage 2.1 and prepare your CoT data.
+```
+accelerate launch --config_file path/to/your/accelerate_config --main_process_port=8888 training/train_mmada_stage4.py config=configs/mmada_pretraining_stage4_llada_instruct.yaml
+```
+### Stage 3 UniGRPO RL
+[Will be released once we finished our code transition to OpenRLHF]
+## 📖 Citation
+```
+@article{yang2025mmada,
+  title={MMaDA: Multimodal Large Diffusion Language Models},
+  author={Yang, Ling and Tian, Ye and Li, Bowen and Zhang, Xinchen and Shen, Ke and Tong, Yunhai and Wang, Mengdi},
+  journal={arXiv preprint arXiv:2505.15809},
+  year={2025}
+}
+```
+## 🤝 Acknowledgments
+This work is heavily based on [Show-o](https://github.com/showlab/Show-o), [LLaDA](https://github.com/ML-GSAI/LLaDA), [maskgit](https://github.com/google-research/maskgit), [transformers](https://github.com/huggingface/transformers), [accelerate](https://github.com/huggingface/accelerate) and [webdataset](https://github.com/webdataset/webdataset). Thanks to all the authors for their great work.
+## 💬 Discussion and Collaboration
+Welcome to discuss and collaborate with us for continuously improving MMaDA. If you have any bad cases, please kindly share them in the [Issue](https://github.com/Gen-Verse/MMaDA/issues/4#issue-3083196081).
+Also, you can reach us with this WeChat QR code!
+<p align="center">
+<img src="assets/wx-mmada-0613.jpeg" width="256">
+</p>

accelerate_configs/1_gpu.yaml ADDED Viewed

	@@ -0,0 +1,15 @@

+compute_environment: LOCAL_MACHINE
+distributed_type: 'NO'
+downcast_bf16: 'no'
+gpu_ids: '0'
+machine_rank: 0
+main_training_function: main
+mixed_precision: bf16
+num_machines: 1
+num_processes: 1
+rdzv_backend: static
+same_network: true
+tpu_env: []
+tpu_use_cluster: false
+tpu_use_sudo: false
+use_cpu: false

accelerate_configs/1_node_8_gpus_deepspeed_zero2.yaml ADDED Viewed

	@@ -0,0 +1,21 @@

+compute_environment: LOCAL_MACHINE
+deepspeed_config:
+  deepspeed_multinode_launcher: standard
+  gradient_accumulation_steps: 1
+  gradient_clipping: 1.0
+  offload_optimizer_device: cpu
+  offload_param_device: cpu
+  zero3_init_flag: true
+  zero_stage: 2
+distributed_type: DEEPSPEED
+downcast_bf16: 'no'
+main_training_function: main
+mixed_precision: bf16
+num_machines: 1
+num_processes: 8
+rdzv_backend: static
+same_network: true
+tpu_env: []
+tpu_use_cluster: false
+tpu_use_sudo: false
+use_cpu: false

accelerate_configs/1_node_8_gpus_deepspeed_zero3.yaml ADDED Viewed

	@@ -0,0 +1,24 @@

+compute_environment: LOCAL_MACHINE
+deepspeed_config:
+  deepspeed_multinode_launcher: standard
+  gradient_accumulation_steps: 2
+  gradient_clipping: 1.0
+  offload_optimizer_device: cpu
+  offload_param_device: cpu
+  zero3_init_flag: true
+  zero3_save_16bit_model: true
+  zero_stage: 3
+  zero_optimization:
+    overlap_comm: false
+distributed_type: DEEPSPEED
+downcast_bf16: 'no'
+main_training_function: main
+mixed_precision: bf16
+num_machines: 1
+num_processes: 8
+rdzv_backend: static
+same_network: true
+tpu_env: []
+tpu_use_cluster: false
+tpu_use_sudo: false
+use_cpu: false

accelerate_configs/8_node_8_gpus_deepspeed_zero2.yaml ADDED Viewed

	@@ -0,0 +1,21 @@

+compute_environment: LOCAL_MACHINE
+deepspeed_config:
+  deepspeed_multinode_launcher: standard
+  gradient_accumulation_steps: 1
+  gradient_clipping: 1.0
+  offload_optimizer_device: cpu
+  offload_param_device: cpu
+  zero3_init_flag: true
+  zero_stage: 2
+distributed_type: DEEPSPEED
+downcast_bf16: 'no'
+main_training_function: main
+mixed_precision: bf16
+num_machines: 8
+num_processes: 64
+rdzv_backend: static
+same_network: true
+tpu_env: []
+tpu_use_cluster: false
+tpu_use_sudo: false
+use_cpu: false

app.py ADDED Viewed

	@@ -0,0 +1,894 @@

+import gradio as gr
+import torch
+import numpy as np
+import torch.nn.functional as F
+from transformers import AutoTokenizer
+from torchvision import transforms
+from models import MAGVITv2, get_mask_schedule, MMadaModelLM
+from training.prompting_utils import UniversalPrompting
+from PIL import Image
+def image_transform(image, resolution=256, normalize=True):
+    image = transforms.Resize(resolution, interpolation=transforms.InterpolationMode.BICUBIC)(image)
+    image = transforms.CenterCrop((resolution, resolution))(image)
+    image = transforms.ToTensor()(image)
+    if normalize:
+        image = transforms.Normalize(mean=[0.5, 0.5, 0.5], std=[0.5, 0.5, 0.5], inplace=True)(image)
+    return image
+def add_gumbel_noise(logits, temperature):
+    """
+    Adds Gumbel noise to logits for stochastic sampling.
+    Equivalent to argmax(logits + temperature * G) where G ~ Gumbel(0,1).
+    This version is more numerically stable than a version involving exp() and division.
+    """
+    if abs(temperature) < 1e-9: # Effectively zero temperature
+        return logits
+    # Ensure logits are float64 for precision with noise, as suggested by user context
+    if DEVICE == "mps":
+        logits = logits.to(torch.float32)
+    else:
+        logits = logits.to(torch.float64)
+    # Standard Gumbel noise: -log(-log(U)), U ~ Uniform(0,1)
+    # Add small epsilon for numerical stability inside logs
+    if DEVICE == "mps":
+        noise = torch.rand_like(logits, dtype=torch.float32)
+    else:
+        noise = torch.rand_like(logits, dtype=torch.float64)
+    standard_gumbel_noise = -torch.log(-torch.log(noise + 1e-20) + 1e-20)
+    return logits + temperature * standard_gumbel_noise
+def get_num_transfer_tokens(mask_index, steps):
+    mask_num = mask_index.sum(dim=1, keepdim=True)
+    # Ensure steps is at least 1 to avoid division by zero if mask_num is also 0 (though sum should be >=0)
+    steps = max(1, int(steps)) # Ensure steps is a positive integer
+    base = mask_num // steps
+    remainder = mask_num % steps
+    num_transfer_tokens = torch.zeros(mask_num.size(0), steps, device=mask_index.device, dtype=torch.long) + base
+    for i in range(mask_num.size(0)): # Iterate over batch
+        if remainder[i] > 0 : # Ensure remainder is positive before indexing
+             num_transfer_tokens[i, :remainder[i].item()] += 1 # .item() for single value tensor to int
+    return num_transfer_tokens
+MODEL = None
+TOKENIZER = None
+DEVICE = (
+    "cuda"
+    if torch.cuda.is_available()
+    else "mps" if torch.backends.mps.is_available() else "cpu"
+)
+MASK_ID = None
+uni_prompting = None
+VQ_MODEL = MAGVITv2().from_pretrained("showlab/magvitv2").to(DEVICE)
+DEFAULT_MODEL_PATH = "Gen-Verse/MMaDA-8B-Base" # Default
+CURRENT_MODEL_PATH = None
+MODEL_CHOICES = [
+    "MMaDA-8B-Base",
+    "MMaDA-8B-MixCoT (coming soon)",
+    "MMaDA-8B-Max (coming soon)"
+]
+MODEL_ACTUAL_PATHS = {
+    "MMaDA-8B-Base": DEFAULT_MODEL_PATH,
+}
+def clear_outputs_action():
+        return None, None
+def _load_model_and_tokenizer_core(model_path_to_load, model_display_name_for_status):
+    global MODEL, TOKENIZER, MASK_ID, CURRENT_MODEL_PATH, DEVICE, uni_prompting
+    if MODEL is not None and CURRENT_MODEL_PATH == model_path_to_load:
+        return f"Model '{model_display_name_for_status}' from '{model_path_to_load}' is already loaded. MASK_ID: {MASK_ID}"
+    CURRENT_MODEL_PATH = model_path_to_load
+    status_msg_parts = [f"Loading '{model_display_name_for_status}'..."]
+    try:
+        TOKENIZER = AutoTokenizer.from_pretrained(model_path_to_load, trust_remote_code=True)
+        status_msg_parts.append(f"Tokenizer for '{model_display_name_for_status}' loaded.")
+        MODEL = MMadaModelLM.from_pretrained(model_path_to_load, trust_remote_code=True, torch_dtype=torch.bfloat16).to(DEVICE).eval()
+        status_msg_parts.append(f"Model '{model_display_name_for_status}' loaded to {DEVICE}.")
+        uni_prompting = UniversalPrompting(TOKENIZER, max_text_len=512, special_tokens=("<|soi|>", "<|eoi|>", "<|sov|>", "<|eov|>", "<|t2i|>", "<|mmu|>", "<|t2v|>", "<|v2v|>", "<|lvg|>"),ignore_id=-100, cond_dropout_prob=0.1, use_reserved_token=True)
+        if hasattr(TOKENIZER, 'mask_token_id') and TOKENIZER.mask_token_id is not None:
+            MASK_ID = TOKENIZER.mask_token_id
+            status_msg_parts.append(f"Using MASK_ID from tokenizer: {MASK_ID}.")
+        else:
+            MASK_ID = 126336
+            status_msg_parts.append(f"Using default MASK_ID: {MASK_ID}.")
+        if TOKENIZER.pad_token_id is None:
+            if TOKENIZER.eos_token_id is not None:
+                TOKENIZER.pad_token_id = TOKENIZER.eos_token_id
+                TOKENIZER.pad_token = TOKENIZER.eos_token
+                status_msg_parts.append(f"Set pad_token_id to eos_token_id ({TOKENIZER.eos_token_id}).")
+            else:
+                status_msg_parts.append("Warning: pad_token_id is None and no eos_token_id.")
+        if TOKENIZER.eos_token_id is None: # Important for cleaning up output in visualization
+             status_msg_parts.append("Warning: tokenizer.eos_token_id is None. EOS cleanup might not work.")
+        TOKENIZER.chat_template = "{% set loop_messages = messages %}{% for message in loop_messages %}{% set content = '<|start_header_id|>' + message['role'] + '<|end_header_id|>\n'+ message['content'] | trim + '<|eot_id|>' %}{% if loop.index0 == 0 %}{% set content = bos_token + content %}{% endif %}{{ content }}{% endfor %}{{ '<|start_header_id|>assistant<|end_header_id|>\n' }}"
+        return " ".join(status_msg_parts)
+    except Exception as e:
+        MODEL = None
+        TOKENIZER = None
+        MASK_ID = None
+        CURRENT_MODEL_PATH = None
+        return f"Error loading model '{model_display_name_for_status}': {str(e)}"
+def handle_model_selection_change(selected_model_name_ui):
+    if "coming soon" in selected_model_name_ui.lower():
+        global MODEL, TOKENIZER, MASK_ID, CURRENT_MODEL_PATH
+        MODEL = None
+        TOKENIZER = None
+        MASK_ID = None
+        CURRENT_MODEL_PATH = None
+        return f"'{selected_model_name_ui}' is not yet available. Please select 'Model A'."
+    actual_path = MODEL_ACTUAL_PATHS.get(selected_model_name_ui)
+    if not actual_path:
+        return f"Path for '{selected_model_name_ui}' is not defined. Cannot load."
+    return _load_model_and_tokenizer_core(actual_path, selected_model_name_ui)
+def get_highlighted_text_tuples(current_x_ids_batch, prompt_input_ids, prompt_len, tk, current_mask_id, raw_prompt_attention_mask):
+    if current_x_ids_batch is None or current_x_ids_batch.ndim == 0 or current_x_ids_batch.shape[0] == 0:
+        return [("Error in sequence data for visualization.", "ERROR")]
+    # only answer part
+    current_x_ids_batch = current_x_ids_batch[:, prompt_len:]
+    seq_ids = current_x_ids_batch[0].tolist()
+    eos_token_id = tk.eos_token_id  # Get EOS token ID
+    # Stage 1: Build initial list of tuples with (token_str, label, token_id_int)
+    # This helps in identifying EOS tokens later without re-checking the type.
+    intermediate_tuples = []
+    for j, token_id_int in enumerate(seq_ids):
+        try:
+            token_str = tk.decode([token_id_int], skip_special_tokens=True, clean_up_tokenization_spaces=False)
+        except Exception: # Handle cases where a token ID might be problematic (e.g. with mock)
+            token_str = f"[ID:{token_id_int}]"
+        label = "ERROR"
+        if token_id_int == current_mask_id:
+            token_str = "[MASK]"
+            label = "MASK"
+        else:
+            label = "GEN"
+        intermediate_tuples.append((token_str, label, token_id_int))
+    return intermediate_tuples
+@torch.no_grad()
+def generate_viz_wrapper_t2i(prompt_text, steps, guidance_scale, mask_schedule="cosine"):
+    global MODEL, TOKENIZER, MASK_ID, DEVICE, uni_prompting
+    if MODEL is None or TOKENIZER is None or MASK_ID is None:
+        yield [("Error: Model not loaded. Please load the model first.", "ERROR")], "Model not loaded."
+        return
+    steps = int(steps)
+    guidance_scale = float(guidance_scale)
+    image_tokens = torch.ones((1, 1024), dtype=torch.long, device=DEVICE) * MASK_ID
+    prompt_text = [prompt_text]
+    input_ids, attention_mask = uni_prompting((prompt_text, image_tokens), 't2i_gen')
+    if guidance_scale > 0:
+        uncond_input_ids, uncond_attention_mask = uni_prompting(([''], image_tokens), 't2i_gen')
+    else:
+        uncond_input_ids, uncond_attention_mask = None, None
+    mask_schedule = get_mask_schedule(mask_schedule)
+    blank_image = Image.new("RGB", (512, 512), (255, 255, 255))
+    yield blank_image, "Starting generation..."
+    for image_step, status_msg_step in MODEL.t2i_generate_decoding_stepwise(
+            input_ids = input_ids,
+            uncond_input_ids = uncond_input_ids,
+            attention_mask = attention_mask,
+            uncond_attention_mask = uncond_attention_mask,
+            temperature=1.0,
+            timesteps = steps,
+            guidance_scale = guidance_scale,
+            noise_schedule = mask_schedule,
+            noise_type = "mask",
+            seq_len = 1024,
+            vq_model = VQ_MODEL,
+            uni_prompting=uni_prompting):
+        yield image_step, status_msg_step
+@torch.no_grad()
+def generate_viz_wrapper_lm(prompt_text, steps, gen_length, block_length, temperature,
+                         cfg_scale, remasking_strategy, thinking_mode_lm):
+    global MODEL, TOKENIZER, MASK_ID, DEVICE
+    print(f"thinking_mode_lm: {thinking_mode_lm}")
+    if MODEL is None or TOKENIZER is None or MASK_ID is None:
+        yield [("Error: Model not loaded. Please load the model first.", "ERROR")], "Model not loaded."
+        return
+    steps = int(steps)
+    gen_length = int(gen_length)
+    block_length = int(block_length)
+    if thinking_mode_lm:
+        prompt_text = "You should first think about the reasoning process in the mind and then provide the user with the answer. The reasoning process is enclosed within <think> </think> tags, i.e. <think> reasoning process here </think> answer here\n" + prompt_text
+    try:
+        m = [{"role": "user", "content": prompt_text}]
+        processed_prompt_text = TOKENIZER.apply_chat_template(m, add_generation_prompt=True, tokenize=False)
+    except Exception as e:
+        yield [("Error applying chat template.", "ERROR")], f"Chat template error: {e}"
+        processed_prompt_text = prompt_text
+    try:
+        if TOKENIZER.pad_token_id is None:
+            if TOKENIZER.eos_token_id is not None:
+                TOKENIZER.pad_token_id = TOKENIZER.eos_token_id
+            else: # Should have been caught by load_model, but double check
+                 yield [("Tokenizer Error", "ERROR")], "pad_token_id is not set in tokenizer."
+                 return
+        input_ids = TOKENIZER(text=processed_prompt_text, return_tensors="pt", padding="longest", padding_side="left", truncation=True, max_length=MODEL.config.max_position_embeddings if hasattr(MODEL.config, 'max_position_embeddings') else 2048)['input_ids'].to(DEVICE)
+        raw_prompt_attention_mask = None
+    except Exception as e:
+        yield [("Error tokenizing prompt.", "ERROR")], f"Tokenization error: {e}"
+        return
+    batch_size = input_ids.shape[0]
+    prompt_len = input_ids.shape[1]
+    x = torch.full((batch_size, prompt_len + gen_length), MASK_ID, dtype=torch.long, device=DEVICE)
+    x[:, :prompt_len] = input_ids.clone()
+    yield get_highlighted_text_tuples(x, input_ids, prompt_len, TOKENIZER, MASK_ID, raw_prompt_attention_mask), "Starting generation: Prompt + Initial Masks"
+    if gen_length == 0:
+         final_text_output = TOKENIZER.batch_decode(x[:,prompt_len:], skip_special_tokens=True)
+         yield get_highlighted_text_tuples(x, input_ids, prompt_len, TOKENIZER, MASK_ID, raw_prompt_attention_mask), final_text_output[0] if final_text_output else ""
+         return
+    if block_length <= 0 or gen_length % block_length != 0 :
+        yield get_highlighted_text_tuples(x, input_ids, prompt_len, TOKENIZER, MASK_ID, raw_prompt_attention_mask), \
+              f"Error: gen_length ({gen_length}) must be divisible by block_length ({block_length}) and block_length > 0."
+        return
+    num_blocks = gen_length // block_length
+    if steps <=0 or steps % num_blocks != 0:
+        yield get_highlighted_text_tuples(x, input_ids, prompt_len, TOKENIZER, MASK_ID, raw_prompt_attention_mask), \
+              f"Error: steps ({steps}) must be positive and divisible by num_blocks ({num_blocks}). Steps: {steps}, Num Blocks: {num_blocks}"
+        return
+    steps_per_block = steps // num_blocks
+    for num_block_iter in range(num_blocks):
+        current_block_start_idx_in_x = prompt_len + num_block_iter * block_length
+        current_block_end_idx_in_x = prompt_len + (num_block_iter + 1) * block_length
+        block_masks_bool_current = torch.zeros_like(x, dtype=torch.bool)
+        block_masks_bool_current[:, current_block_start_idx_in_x:current_block_end_idx_in_x] = \
+            (x[:, current_block_start_idx_in_x:current_block_end_idx_in_x] == MASK_ID)
+        num_transfer_tokens_for_this_block = get_num_transfer_tokens(
+            block_masks_bool_current[:, current_block_start_idx_in_x:current_block_end_idx_in_x],
+            steps_per_block
+        )
+        for i_step_in_block in range(steps_per_block):
+            mask_index_global = (x == MASK_ID)
+            if cfg_scale > 0.:
+                un_x = x.clone()
+                # For unconditional pass, mask out the original prompt tokens that are not padding
+                # raw_prompt_attention_mask is (B, prompt_len)
+                prompt_active_tokens_mask = raw_prompt_attention_mask.bool() # True where actual prompt tokens are
+                un_x[:, :prompt_len][prompt_active_tokens_mask] = MASK_ID
+                x_cfg_input = torch.cat([x, un_x], dim=0)
+                # Pass attention_mask for CFG if model expects it, covering both parts
+                # For simplicity, not passing explicit attention_mask here; relies on model's internal handling.
+                model_output = MODEL(x_cfg_input)
+                logits_cond, logits_uncond = torch.chunk(model_output.logits, 2, dim=0)
+                logits = logits_uncond + (cfg_scale + 1) * (logits_cond - logits_uncond)
+            else:
+                # Not passing explicit attention_mask here; relies on model's internal handling.
+                model_output = MODEL(x)
+                logits = model_output.logits
+            logits_with_noise = add_gumbel_noise(logits, temperature=temperature)
+            x0_predicted_tokens = torch.argmax(logits_with_noise, dim=-1)
+            if remasking_strategy == 'low_confidence':
+                if DEVICE == "mps":
+                    probs = F.softmax(logits.to(torch.float32), dim=-1)
+                else:
+                    probs = F.softmax(logits.to(torch.float64), dim=-1)
+                x0_probs = torch.gather(probs, dim=-1, index=x0_predicted_tokens.unsqueeze(-1)).squeeze(-1)
+            elif remasking_strategy == 'random':
+                if DEVICE == "mps":
+                    x0_probs = torch.rand(x.shape, device=x.device, dtype=torch.float32)
+                else:
+                    x0_probs = torch.rand(x.shape, device=x.device, dtype=torch.float64)
+            else:
+                yield get_highlighted_text_tuples(x, input_ids, prompt_len, TOKENIZER, MASK_ID, raw_prompt_attention_mask), f"Error: Unknown remasking strategy '{remasking_strategy}'"
+                return
+            confidence_for_selection = torch.full_like(x0_probs, -torch.inf)
+            candidate_positions_for_unmasking = mask_index_global & block_masks_bool_current
+            confidence_for_selection = torch.where(
+                candidate_positions_for_unmasking,
+                x0_probs,
+                -torch.inf
+            )
+            x0_final_candidates = torch.where(mask_index_global, x0_predicted_tokens, x)
+            transfer_indices_bool = torch.zeros_like(x, dtype=torch.bool)
+            num_to_transfer_this_step_batch = num_transfer_tokens_for_this_block[:, i_step_in_block]
+            for j_batch_idx in range(batch_size):
+                k_val = min(num_to_transfer_this_step_batch[j_batch_idx].item(),
+                            candidate_positions_for_unmasking[j_batch_idx].sum().item()) # ensure k isn't too large
+                if k_val > 0:
+                    # Ensure confidence_for_selection[j_batch_idx] is 1D for topk
+                    conf_slice = confidence_for_selection[j_batch_idx]
+                    if conf_slice.ndim > 1: conf_slice = conf_slice.view(-1) # Should already be 1D from x0_probs
+                    # Check if there are enough valid (non -inf) confidences
+                    valid_conf_count = (conf_slice > -torch.inf).sum().item()
+                    actual_k = min(k_val, valid_conf_count)
+                    if actual_k > 0:
+                        _, topk_indices_in_x = torch.topk(conf_slice, k=actual_k)
+                        transfer_indices_bool[j_batch_idx, topk_indices_in_x] = True
+            x[transfer_indices_bool] = x0_final_candidates[transfer_indices_bool]
+            current_total_step = num_block_iter * steps_per_block + i_step_in_block + 1
+            total_overall_steps = num_blocks * steps_per_block
+            status_msg = f"Block {num_block_iter+1}/{num_blocks}, Step {i_step_in_block+1}/{steps_per_block} (Total: {current_total_step}/{total_overall_steps})"
+            yield get_highlighted_text_tuples(x, input_ids, prompt_len, TOKENIZER, MASK_ID, raw_prompt_attention_mask), status_msg
+    final_generated_ids = x[:, prompt_len:]
+    final_text_output = TOKENIZER.batch_decode(final_generated_ids, skip_special_tokens=True)
+    final_text_str = final_text_output[0] if final_text_output and len(final_text_output) > 0 else ""
+    yield get_highlighted_text_tuples(x, input_ids, prompt_len, TOKENIZER, MASK_ID, raw_prompt_attention_mask), final_text_str
+@torch.no_grad()
+def generate_viz_wrapper(uploaded_image_pil, prompt_text, steps, gen_length, block_length, temperature,
+                         cfg_scale, remasking_strategy, thinking_mode_mmu):
+    global MODEL, TOKENIZER, MASK_ID, DEVICE
+    if MODEL is None or TOKENIZER is None or MASK_ID is None:
+        yield [("Error: Model not loaded. Please load the model first.", "ERROR")], "Model not loaded."
+        return
+    steps = int(steps)
+    gen_length = int(gen_length)
+    block_length = int(block_length)
+    if thinking_mode_mmu:
+        prompt_text = "You should first think about the reasoning process in the mind and then provide the user with the answer. The reasoning process is enclosed within <think> </think> tags, i.e. <think> reasoning process here </think> answer here\n" + prompt_text
+    try:
+        m = [{"role": "user", "content": prompt_text}]
+        processed_prompt_text = TOKENIZER.apply_chat_template(m, add_generation_prompt=True, tokenize=False)
+    except Exception as e:
+        yield [("Error applying chat template.", "ERROR")], f"Chat template error: {e}"
+        processed_prompt_text = prompt_text
+    image_vq_ids_tensor = None
+    if uploaded_image_pil is not None:
+        try:
+            image = image_transform(uploaded_image_pil, resolution=512).to(DEVICE)
+            image = image.unsqueeze(0)
+            image_vq_ids_tensor = VQ_MODEL.get_code(image)  + 126349
+        except Exception as e:
+            yield [("Error processing image.", "ERROR")], f"Image to VQ tokens conversion failed: {str(e)}"
+            return
+    try:
+        if TOKENIZER.pad_token_id is None:
+            if TOKENIZER.eos_token_id is not None:
+                TOKENIZER.pad_token_id = TOKENIZER.eos_token_id
+            else:
+                 yield [("Tokenizer Error", "ERROR")], "pad_token_id is not set in tokenizer."
+                 return
+        input_ids = TOKENIZER(text=processed_prompt_text, return_tensors="pt", padding="longest", padding_side="left", truncation=True, max_length=MODEL.config.max_position_embeddings if hasattr(MODEL.config, 'max_position_embeddings') else 2048)['input_ids'].to(DEVICE)
+        raw_prompt_attention_mask = None
+        if image_vq_ids_tensor is not None:
+            if image_vq_ids_tensor.ndim == 1:
+                image_vq_ids_tensor = image_vq_ids_tensor.unsqueeze(0)
+            input_ids = torch.cat([
+                (torch.ones(input_ids.shape[0], 1) * torch.tensor([126089])).to(DEVICE),
+                (torch.ones(input_ids.shape[0], 1) * torch.tensor([126084])).to(DEVICE),
+                image_vq_ids_tensor,
+                (torch.ones(input_ids.shape[0], 1) * torch.tensor([126085])).to(DEVICE),
+                input_ids
+            ], dim=1).long()
+        else:
+            input_ids = input_ids
+    except Exception as e:
+        yield [("Error tokenizing prompt.", "ERROR")], f"Tokenization error: {e}"
+        return
+    batch_size = input_ids.shape[0]
+    prompt_len = input_ids.shape[1]
+    x = torch.full((batch_size, prompt_len + gen_length), MASK_ID, dtype=torch.long, device=DEVICE)
+    x[:, :prompt_len] = input_ids.clone()
+    yield get_highlighted_text_tuples(x, input_ids, prompt_len, TOKENIZER, MASK_ID, raw_prompt_attention_mask), "Starting generation: Prompt + Initial Masks"
+    if gen_length == 0:
+         final_text_output = TOKENIZER.batch_decode(x[:,prompt_len:], skip_special_tokens=True)
+         yield get_highlighted_text_tuples(x, input_ids, prompt_len, TOKENIZER, MASK_ID, raw_prompt_attention_mask), final_text_output[0] if final_text_output else ""
+         return
+    if block_length <= 0 or gen_length % block_length != 0 :
+        yield get_highlighted_text_tuples(x, input_ids, prompt_len, TOKENIZER, MASK_ID, raw_prompt_attention_mask), \
+              f"Error: gen_length ({gen_length}) must be divisible by block_length ({block_length}) and block_length > 0."
+        return
+    num_blocks = gen_length // block_length
+    if steps <=0 or steps % num_blocks != 0:
+        yield get_highlighted_text_tuples(x, input_ids, prompt_len, TOKENIZER, MASK_ID, raw_prompt_attention_mask), \
+              f"Error: steps ({steps}) must be positive and divisible by num_blocks ({num_blocks}). Steps: {steps}, Num Blocks: {num_blocks}"
+        return
+    steps_per_block = steps // num_blocks
+    for num_block_iter in range(num_blocks):
+        current_block_start_idx_in_x = prompt_len + num_block_iter * block_length
+        current_block_end_idx_in_x = prompt_len + (num_block_iter + 1) * block_length
+        block_masks_bool_current = torch.zeros_like(x, dtype=torch.bool)
+        block_masks_bool_current[:, current_block_start_idx_in_x:current_block_end_idx_in_x] = \
+            (x[:, current_block_start_idx_in_x:current_block_end_idx_in_x] == MASK_ID)
+        num_transfer_tokens_for_this_block = get_num_transfer_tokens(
+            block_masks_bool_current[:, current_block_start_idx_in_x:current_block_end_idx_in_x],
+            steps_per_block
+        )
+        for i_step_in_block in range(steps_per_block):
+            mask_index_global = (x == MASK_ID)
+            if cfg_scale > 0.:
+                un_x = x.clone()
+                # For unconditional pass, mask out the original prompt tokens that are not padding
+                # raw_prompt_attention_mask is (B, prompt_len)
+                prompt_active_tokens_mask = raw_prompt_attention_mask.bool() # True where actual prompt tokens are
+                un_x[:, :prompt_len][prompt_active_tokens_mask] = MASK_ID
+                x_cfg_input = torch.cat([x, un_x], dim=0)
+                # Pass attention_mask for CFG if model expects it, covering both parts
+                # For simplicity, not passing explicit attention_mask here; relies on model's internal handling.
+                model_output = MODEL(x_cfg_input)
+                logits_cond, logits_uncond = torch.chunk(model_output.logits, 2, dim=0)
+                logits = logits_uncond + (cfg_scale + 1) * (logits_cond - logits_uncond)
+            else:
+                # Not passing explicit attention_mask here; relies on model's internal handling.
+                model_output = MODEL(x)
+                logits = model_output.logits
+            logits_with_noise = add_gumbel_noise(logits, temperature=temperature)
+            x0_predicted_tokens = torch.argmax(logits_with_noise, dim=-1)
+            if remasking_strategy == 'low_confidence':
+                if DEVICE == "mps":
+                    probs = F.softmax(logits.to(torch.float32), dim=-1)
+                else:
+                    probs = F.softmax(logits.to(torch.float64), dim=-1)
+                x0_probs = torch.gather(probs, dim=-1, index=x0_predicted_tokens.unsqueeze(-1)).squeeze(-1)
+            elif remasking_strategy == 'random':
+                if DEVICE == "mps":
+                    x0_probs = torch.rand(x.shape, device=x.device, dtype=torch.float32)
+                else:
+                    x0_probs = torch.rand(x.shape, device=x.device, dtype=torch.float64)
+            else:
+                yield get_highlighted_text_tuples(x, input_ids, prompt_len, TOKENIZER, MASK_ID, raw_prompt_attention_mask), f"Error: Unknown remasking strategy '{remasking_strategy}'"
+                return
+            confidence_for_selection = torch.full_like(x0_probs, -torch.inf)
+            candidate_positions_for_unmasking = mask_index_global & block_masks_bool_current
+            confidence_for_selection = torch.where(
+                candidate_positions_for_unmasking,
+                x0_probs,
+                -torch.inf
+            )
+            x0_final_candidates = torch.where(mask_index_global, x0_predicted_tokens, x)
+            transfer_indices_bool = torch.zeros_like(x, dtype=torch.bool)
+            num_to_transfer_this_step_batch = num_transfer_tokens_for_this_block[:, i_step_in_block]
+            for j_batch_idx in range(batch_size):
+                k_val = min(num_to_transfer_this_step_batch[j_batch_idx].item(),
+                            candidate_positions_for_unmasking[j_batch_idx].sum().item()) # ensure k isn't too large
+                if k_val > 0:
+                    # Ensure confidence_for_selection[j_batch_idx] is 1D for topk
+                    conf_slice = confidence_for_selection[j_batch_idx]
+                    if conf_slice.ndim > 1: conf_slice = conf_slice.view(-1) # Should already be 1D from x0_probs
+                    # Check if there are enough valid (non -inf) confidences
+                    valid_conf_count = (conf_slice > -torch.inf).sum().item()
+                    actual_k = min(k_val, valid_conf_count)
+                    if actual_k > 0:
+                        _, topk_indices_in_x = torch.topk(conf_slice, k=actual_k)
+                        transfer_indices_bool[j_batch_idx, topk_indices_in_x] = True
+            x[transfer_indices_bool] = x0_final_candidates[transfer_indices_bool]
+            current_total_step = num_block_iter * steps_per_block + i_step_in_block + 1
+            total_overall_steps = num_blocks * steps_per_block
+            status_msg = f"Block {num_block_iter+1}/{num_blocks}, Step {i_step_in_block+1}/{steps_per_block} (Total: {current_total_step}/{total_overall_steps})"
+            yield get_highlighted_text_tuples(x, input_ids, prompt_len, TOKENIZER, MASK_ID, raw_prompt_attention_mask), status_msg
+    final_generated_ids = x[:, prompt_len:]
+    final_text_output = TOKENIZER.batch_decode(final_generated_ids, skip_special_tokens=True)
+    final_text_str = final_text_output[0] if final_text_output and len(final_text_output) > 0 else ""
+    yield get_highlighted_text_tuples(x, input_ids, prompt_len, TOKENIZER, MASK_ID, raw_prompt_attention_mask), final_text_str
+css_styles = """
+.gradio-container{font-family:'IBM Plex Sans',sans-serif;margin:auto;}
+.gr-input {background:#f9f9f9 !important;border:1px solid #e0e0e0 !important;}
+.gr-output{background:#f0f0f0 !important;border:1px solid #d0d0d0 !important;}
+.highlighted-text span{
+    padding:2px 4px;border-radius:4px;margin:1px 2px;display:inline-block;line-height:1.6;
+}
+footer{display:none !important}
+#live-update-scrollable-box {
+    max-height: 800px; /* 您可以根据需要调整这个最大高度，例如 '300px', '50vh' 等 */
+    overflow-y: auto !important; /* 当内容超出 max-height 时显示垂直滚动条 */
+    display: block; /* 确保元素是块级元素，以便 max-height 生效 */
+}
+#think_btn {
+    background-color: #f3f4f6 !important;
+    border: 1px solid #d0d0d0 !important;
+    color: #111827 !important;
+    font-size: 16px !important;
+    font-weight: bold !important;
+}
+#think_btn:hover {
+    background-color: #e0e0e0 !important;
+    border: 1px solid #c0c0c0 !important;
+    color: #222 !important;
+}
+#think_btn:active {
+    background-color: #2563eb !important;
+    border: 1px solid #b0b0b0 !important;
+    color: white !important;
+}
+"""
+# thinking_mode_t2i = gr.State(False)
+def toggle_thinking_mode_lm(current_thinking_mode):
+    # print(f"current_thinking_mode: {current_thinking_mode}")
+    new_state = not current_thinking_mode
+    new_label = "Thinking Mode ✅" if new_state else "Thinking Mode ❌"
+    return new_state, gr.update(value=new_label)
+def toggle_thinking_mode_mmu(current_thinking_mode):
+    new_state = not current_thinking_mode
+    new_label = "Thinking Mode ✅" if new_state else "Thinking Mode ❌"
+    return new_state, gr.update(value=new_label)
+color_map_config = {
+    "MASK": "lightgrey",
+    "GEN": "#DCABFA",
+}
+theme = gr.themes.Ocean(
+    primary_hue="fuchsia",
+)
+with gr.Blocks(css=css_styles, theme=theme) as demo:
+# with gr.Blocks(css=css_styles, theme=gr.themes.Soft(primary_hue=gr.themes.colors.blue, secondary_hue=gr.themes.colors.sky)) as demo:
+# with gr.Blocks() as demo:
+    thinking_mode_lm = gr.State(False)
+    thinking_mode_mmu = gr.State(False)
+    gr.Markdown("<h1 style='text-align: center; margin-bottom: 20px;'>MMaDA: Multimodal Large Diffusion Language Models</h1>")
+    gr.Markdown("MMaDA is a novel class of multimodal diffusion foundation models designed to achieve superior performance across diverse domains such as textual reasoning, multimodal understanding, and text-to-image generation")
+    gr.Markdown("Github: [Gen-Verse/MMaDA](https://github.com/Gen-Verse/MMaDA)")
+    gr.Markdown("Paper: [MMaDA: Multimodal Large Diffusion Language Models]()")
+    gr.Markdown("### Select Model")
+    with gr.Row():
+        model_select_radio = gr.Radio(
+            label="Select Text Generation Model",
+            choices=MODEL_CHOICES,
+            value=MODEL_CHOICES[0]
+        )
+        model_load_status_box = gr.Textbox(
+            label="Model Load Status",
+            interactive=False,
+            lines=3,
+            max_lines=5
+        )
+    gr.Markdown("## Part 1. Text Generation")
+    with gr.Row():
+        with gr.Column(scale=2):
+            prompt_input_box_lm = gr.Textbox(label="Enter your prompt:", lines=3, value="A rectangular prism has a length of 5 units, a width of 4 units, and a height of 3 units. What is the volume of the prism?")
+            think_button_lm = gr.Button("🧠 Enable Thinking Mode", elem_id="think_btn")
+            with gr.Accordion("Generation Parameters", open=True):
+                with gr.Row():
+                    gen_length_slider_lm = gr.Slider(minimum=8, maximum=1024, value=512, step=64, label="Generation Length", info="Number of tokens to generate.")
+                    steps_slider_lm = gr.Slider(minimum=1, maximum=512, value=256, step=32, label="Total Sampling Steps", info="Must be divisible by (gen_length / block_length).")
+                with gr.Row():
+                    block_length_slider_lm = gr.Slider(minimum=8, maximum=1024, value=128, step=32, label="Block Length", info="gen_length must be divisible by this.")
+                    remasking_dropdown_lm = gr.Dropdown(choices=['low_confidence', 'random'], value='low_confidence', label="Remasking Strategy")
+                with gr.Row():
+                    cfg_scale_slider_lm = gr.Slider(minimum=0.0, maximum=2.0, value=0.0, step=0.1, label="CFG Scale", info="Classifier-Free Guidance. 0 disables it.")
+                    temperature_slider_lm = gr.Slider(minimum=0.0, maximum=2.0, value=1, step=0.05, label="Temperature", info="Controls randomness via Gumbel noise. 0 is deterministic.")
+            with gr.Row():
+                run_button_ui_lm = gr.Button("Generate Sequence", variant="primary", scale=3)
+                clear_button_ui_lm = gr.Button("Clear Outputs", scale=1)
+        with gr.Column(scale=3):
+            # gr.Markdown("## Live Generation Process")
+            output_visualization_box_lm = gr.HighlightedText(
+                label="Live Generation Process",
+                show_legend=True,
+                color_map=color_map_config,
+                combine_adjacent=False,
+                interactive=False,
+                elem_id="live-update-scrollable-box",
+            )
+            # gr.Markdown("## Final Generated Text")
+            output_final_text_box_lm = gr.Textbox(label="Final Output", lines=8, interactive=False, show_copy_button=True)
+    gr.Examples(
+        examples=[
+            ["A rectangular prism has a length of 5 units, a width of 4 units, and a height of 3 units. What is the volume of the prism?", 256, 512, 128, 1, 0, "low_confidence"],
+            ["Lily can run 12 kilometers per hour for 4 hours. After that, she can run 6 kilometers per hour. How many kilometers can she run in 8 hours?", 256, 512, 64, 1, 0, "low_confidence"]
+        ],
+        inputs=[prompt_input_box_lm, steps_slider_lm, gen_length_slider_lm, block_length_slider_lm, temperature_slider_lm, cfg_scale_slider_lm, remasking_dropdown_lm],
+        outputs=[output_visualization_box_lm, output_final_text_box_lm],
+        fn=generate_viz_wrapper_lm,
+    )
+    gr.Markdown("---")
+    gr.Markdown("## Part 2. Multimodal Understanding")
+    with gr.Row():
+        with gr.Column(scale=2):
+            prompt_input_box_mmu = gr.Textbox(
+                label="Enter your prompt:",
+                lines=3,
+                value="Please describe this image in detail."
+            )
+            think_button_mmu = gr.Button("🧠 Enable Thinking Mode", elem_id="think_btn")
+            with gr.Accordion("Generation Parameters", open=True):
+                with gr.Row():
+                    gen_length_slider_mmu = gr.Slider(minimum=64, maximum=1024, value=512, step=64, label="Generation Length", info="Number of tokens to generate.")
+                    steps_slider_mmu = gr.Slider(minimum=1, maximum=512, value=256, step=32, label="Total Sampling Steps", info="Must be divisible by (gen_length / block_length).")
+                with gr.Row():
+                    block_length_slider_mmu = gr.Slider(minimum=32, maximum=1024, value=128, step=32, label="Block Length", info="gen_length must be divisible by this.")
+                    remasking_dropdown_mmu = gr.Dropdown(choices=['low_confidence', 'random'], value='low_confidence', label="Remasking Strategy")
+                with gr.Row():
+                    cfg_scale_slider_mmu = gr.Slider(minimum=0.0, maximum=2.0, value=0.0, step=0.1, label="CFG Scale", info="Classifier-Free Guidance. 0 disables it.")
+                    temperature_slider_mmu = gr.Slider(minimum=0.0, maximum=2.0, value=1, step=0.05, label="Temperature", info="Controls randomness via Gumbel noise. 0 is deterministic.")
+            with gr.Row():
+                image_upload_box = gr.Image(type="pil", label="Upload Image")
+            with gr.Row():
+                run_button_ui_mmu = gr.Button("Generate Description", variant="primary", scale=3)
+                clear_button_ui_mmu = gr.Button("Clear Outputs", scale=1)
+        with gr.Column(scale=3):
+            gr.Markdown("## Live Generation Process")
+            output_visualization_box_mmu = gr.HighlightedText(
+                label="Token Sequence (Live Update)",
+                show_legend=True,
+                color_map=color_map_config,
+                combine_adjacent=False,
+                interactive=False,
+                elem_id="live-update-scrollable-box",
+            )
+            gr.Markdown("## Final Generated Text")
+            output_final_text_box_mmu = gr.Textbox(label="Final Output", lines=8, interactive=False, show_copy_button=True)
+    gr.Examples(
+        examples=[
+            [
+                "mmu_validation_2/sunflower.jpg",
+                "Please describe this image in detail.",
+                256,
+                512,
+                128,
+                1,
+                0,
+                "low_confidence"
+            ],
+            [
+                "mmu_validation_2/woman.jpg",
+                "Please describe this image in detail.",
+                256,
+                512,
+                128,
+                1,
+                0,
+                "low_confidence"
+            ]
+        ],
+        inputs=[
+            image_upload_box,
+            prompt_input_box_mmu,
+            steps_slider_mmu,
+            gen_length_slider_mmu,
+            block_length_slider_mmu,
+            temperature_slider_mmu,
+            cfg_scale_slider_mmu,
+            remasking_dropdown_mmu
+        ],
+        outputs=[output_visualization_box_mmu, output_final_text_box_mmu],
+        fn=generate_viz_wrapper,
+    )
+    gr.Markdown("---")
+    gr.Markdown("## Part 3. Text-to-Image Generation")
+    with gr.Row():
+        with gr.Column(scale=2):
+            prompt_input_box_t2i = gr.Textbox(label="Enter your prompt:", lines=3, value="A sea turtle swimming near a coral reef in the ocean, with a clear blue sky and water in the background.")
+            with gr.Accordion("Generation Parameters", open=True):
+                with gr.Row():
+                    steps_slider_t2i = gr.Slider(minimum=5, maximum=100, value=15, step=5, label="Total Sampling Steps", info="Must be divisible by (gen_length / block_length).")
+                    guidance_scale_slider_t2i = gr.Slider(minimum=0.0, maximum=7.0, value=3.5, step=0.5, label="Guidance Scale", info="Classifier-Free Guidance. 0 disables it.")
+            with gr.Row():
+                scheduler_radio_t2i = gr.Radio(
+                    choices=["cosine", "sigmoid", "linear"],
+                    value="cosine",
+                    label="Scheduler",
+                )
+            with gr.Row():
+                run_button_ui_t2i = gr.Button("Generate Image", variant="primary", scale=3)
+                clear_button_ui_t2i = gr.Button("Clear Outputs", scale=1)
+        with gr.Column(scale=3):
+            # gr.Markdown("## Live Generation Process")
+            output_image_t2i = gr.Image(label="Generated Image", interactive=False, type="pil")
+            output_status_t2i = gr.Textbox(label="Generation Status", interactive=False)
+    gr.Examples(
+        examples=[
+            ["A sea turtle swimming near a coral reef in the ocean, with a clear blue sky and water in the background.", 15, 3.5, "cosine"],
+            ["A beautiful sunset over a calm ocean, with a few clouds in the sky.", 15, 3.5, "cosine"]
+        ],
+        inputs=[prompt_input_box_t2i, steps_slider_t2i, guidance_scale_slider_t2i, scheduler_radio_t2i],
+        outputs=[output_image_t2i, output_status_t2i],
+        fn=generate_viz_wrapper_t2i,
+    )
+    run_button_ui_t2i.click(
+        fn=generate_viz_wrapper_t2i,
+        inputs=[
+            prompt_input_box_t2i,
+            steps_slider_t2i,
+            guidance_scale_slider_t2i,
+            scheduler_radio_t2i
+        ],
+        outputs=[output_image_t2i, output_status_t2i]
+    )
+    clear_button_ui_t2i.click(
+        fn=lambda: (None, ""),
+        inputs=None,
+        outputs=[output_image_t2i, output_status_t2i],
+        queue=False
+    )
+    think_button_lm.click(
+        fn=toggle_thinking_mode_lm,
+        inputs=[thinking_mode_lm],
+        outputs=[thinking_mode_lm, think_button_lm]
+    )
+    think_button_mmu.click(
+        fn=toggle_thinking_mode_mmu,
+        inputs=[thinking_mode_mmu],
+        outputs=[thinking_mode_mmu, think_button_mmu]
+    )
+    def initialize_default_model():
+        default_model = "MMaDA-8B-Base"
+        result = handle_model_selection_change(default_model)
+        return default_model, result
+    demo.load(
+        fn=initialize_default_model,
+        inputs=None,
+        outputs=[model_select_radio, model_load_status_box],
+        queue=True
+    )
+    def clear_outputs():
+        return None, None, None  # Clear image, visualization, and final text
+    clear_button_ui_lm.click(
+        fn=clear_outputs,
+        inputs=None,
+        outputs=[image_upload_box, output_visualization_box_lm, output_final_text_box_lm],
+        queue=False
+    )
+    clear_button_ui_mmu.click(
+        fn=clear_outputs,
+        inputs=None,
+        outputs=[image_upload_box, output_visualization_box_mmu, output_final_text_box_mmu],
+        queue=False
+    )
+    run_button_ui_lm.click(
+        fn=generate_viz_wrapper_lm,
+        inputs=[
+            prompt_input_box_lm,
+            steps_slider_lm,
+            gen_length_slider_lm,
+            block_length_slider_lm,
+            temperature_slider_lm,
+            cfg_scale_slider_lm,
+            remasking_dropdown_lm,
+            thinking_mode_lm
+        ],
+        outputs=[output_visualization_box_lm, output_final_text_box_lm]
+    )
+    run_button_ui_mmu.click(
+        fn=generate_viz_wrapper,
+        inputs=[
+            image_upload_box,
+            prompt_input_box_mmu,
+            steps_slider_mmu,
+            gen_length_slider_mmu,
+            block_length_slider_mmu,
+            temperature_slider_mmu,
+            cfg_scale_slider_mmu,
+            remasking_dropdown_mmu,
+            thinking_mode_mmu
+        ],
+        outputs=[output_visualization_box_mmu, output_final_text_box_mmu]
+    )
+if __name__ == "__main__":
+    print(f"Starting Gradio App. Attempting to use device: {DEVICE}")
+    demo.launch(share=True)

assets/WX-mmada-2.jpeg ADDED Viewed

Git LFS Details

SHA256: fd2ecb700ad0ebf462811e32914732bd82ba854aca62b81a00ef9d1f423e148c
Pointer size: 131 Bytes
Size of remote file: 182 kB

assets/WX-mmada-3.jpeg ADDED Viewed

Git LFS Details

SHA256: 3eead150194865be246b2a1923d0be4135188f132e9951b71f315079b0422184
Pointer size: 131 Bytes
Size of remote file: 175 kB

assets/WX-mmada.jpeg ADDED Viewed

Git LFS Details

SHA256: 165df33e6010df2dbe3bc6e47b6a6462ab714cc088f84b59626ee531d137c11c
Pointer size: 131 Bytes
Size of remote file: 181 kB

assets/example_compare.png ADDED Viewed

Git LFS Details

SHA256: 0dc11f8efaed702be76a555ea0dbefe0a2af32f7dddd5d8d308aa0aa02010c9c
Pointer size: 132 Bytes
Size of remote file: 1.68 MB

assets/llm.png ADDED Viewed

assets/mmu.png ADDED Viewed

assets/pipeline.png ADDED Viewed

Git LFS Details

SHA256: 561dca89ec9a990c54772216331f7ac9f8239ba11b54ae27f48015da2af1d29c
Pointer size: 132 Bytes
Size of remote file: 1.75 MB

assets/random.png ADDED Viewed

assets/reward_trend.png ADDED Viewed

assets/showcase0.8.gif ADDED Viewed

Git LFS Details

SHA256: 4e04c775c0f2d1b8b7508ee3918ce1854ba6b27d5b24470eda6d9f78f9afe186
Pointer size: 133 Bytes
Size of remote file: 21.8 MB

assets/t2i.png ADDED Viewed

assets/title.png ADDED Viewed

Git LFS Details

SHA256: 04bf6d10f15732d79e4c365b5d59e055101f68ddd2dfcf89e3a0154fcc0bb047
Pointer size: 131 Bytes
Size of remote file: 362 kB

assets/wx-mmada-0613.jpeg ADDED Viewed

Git LFS Details

SHA256: f0a1d46a0177efbdb41c3c8a9f1933afe4da46855c7bfc5e3b8262569782520e
Pointer size: 131 Bytes
Size of remote file: 179 kB

configs/mmada_demo.yaml ADDED Viewed

	@@ -0,0 +1,95 @@

+wandb:
+  entity: null
+#  run_id: askkz9i2
+  resume: 'auto'
+experiment:
+    project: "demo"
+    name: "mmada-demo"
+    output_dir: "mmada-demo"
+model:
+    vq_model:
+        type: "magvitv2"
+        vq_model_name: "showlab/magvitv2"
+    mmada:
+        pretrained_model_path: "Gen-Verse/MMaDA-8B-Base"
+        w_clip_vit: False
+        new_vocab_size: 134656
+        llm_vocab_size: 126464
+        codebook_size: 8192
+        num_vq_tokens: 1024
+        num_new_special_tokens: 0
+        tie_word_embeddings: False
+    gradient_checkpointing: True
+dataset:
+    gen_type: "imagenet1k"
+    und_type: "captioning"
+    combined_loader_mode: "max_size_cycle"
+    params:
+        train_t2i_shards_path_or_url: "/data_storage/shared/datasets/imagenet-1k/data/train"
+        train_mmu_shards_path_or_url: [ "/data_storage/shared/datasets/SA-1B/sa_{000000..000999}.tar",
+                                        "/data_storage/shared/datasets/cc12m/raw/raw/{0000..0999}.tar",
+                                        "/data_storage/shared/datasets/laion-aesthetics-12m/{00000..01209}.tar"
+        ]
+        train_lm_shards_path_or_url: "/data_storage/shared/datasets/falcon-refinedweb/data/data/*.parquet"
+        add_caption_prompt: True
+        external_caption_path: "/data_storage/shared/datasets/SAM-LLaVA-Captions10M"
+        external_journeydb_caption_path: "/data_storage/shared/datasets/journeydb_anno/train_journeydb_anno.json"
+        external_laion12m_caption_path: "/data_storage/shared/datasets/laion-aesthetic-12m-captions"
+        external_cc12m_caption_path: "/data_storage/shared/datasets/cc12m/captions"
+        validation_prompts_file: "validation_prompts/imagenet_prompts.txt"
+        shuffle_buffer_size: 1000
+        num_workers: 32
+        resolution: 512
+        pin_memory: True
+        persistent_workers: True
+    preprocessing:
+        max_seq_length: 512 # for text tokens
+        resolution: 512
+        center_crop: False
+        random_flip: False
+optimizer:
+    name: adamw
+    params: # default adamw params
+        learning_rate: 5e-5
+        scale_lr: False # scale learning rate by total batch size
+        beta1: 0.9
+        beta2: 0.999
+        weight_decay: 0.01
+        epsilon: 1e-8
+lr_scheduler:
+    scheduler: "cosine"
+    params:
+        learning_rate: ${optimizer.params.learning_rate}
+        warmup_steps: 8000
+training:
+    gradient_accumulation_steps: 4
+    noise_type: "mask"
+    batch_size_t2i: 5
+    batch_size_lm: 1
+    batch_size_mmu: 2
+    mixed_precision: "bf16"
+    enable_tf32: True
+    seed: 10086
+    max_train_steps: 500000
+    overfit_one_batch: False
+    cond_dropout_prob: 0.1
+    min_masking_rate: 0.0
+    label_smoothing: 0.0
+    max_grad_norm: 1
+    guidance_scale: 1.5
+    generation_timesteps: 12
+    t2i_coeff: 1.0
+    lm_coeff: 0.1
+    mmu_coeff: 1.0
+mask_schedule:
+    schedule: "cosine"

configs/mmada_pretraining_stage1_llada_instruct.yaml ADDED Viewed

	@@ -0,0 +1,100 @@

+wandb:
+  entity: null
+#  run_id: askkz9i2
+  resume: 'auto'
+experiment:
+    project: "mmada-training-stage1"
+    name: "mmada-training-stage1-llada-instruct"
+    output_dir: "mmada-training-stage1-llada-instruct"
+    max_train_examples_t2i: 40000000
+    max_train_examples_mmu: 40000000
+    save_every: 10000
+    eval_every: 2500
+    generate_every: 1000
+    log_every: 50
+    log_grad_norm_every: 100
+    resume_from_checkpoint: "latest"
+model:
+    vq_model:
+        type: "magvitv2"
+        vq_model_name: "showlab/magvitv2"
+    mmada:
+        pretrained_model_path: "GSAI-ML/LLaDA-8B-Instruct"
+        w_clip_vit: False
+        new_vocab_size: 134656
+        llm_vocab_size: 126464
+        codebook_size: 8192
+        num_vq_tokens: 256
+        num_new_special_tokens: 0
+        tie_word_embeddings: False
+    gradient_checkpointing: True
+dataset:
+    gen_type: "imagenet1k"
+    und_type: "captioning"
+    combined_loader_mode: "max_size_cycle"
+    params:
+        train_t2i_shards_path_or_url: "/data_storage/shared/datasets/imagenet-1k/data/train"
+        train_mmu_shards_path_or_url: [ "/data_storage/shared/datasets/SA-1B/sa_{000000..000999}.tar",
+                                        "/data_storage/shared/datasets/cc12m/raw/raw/{0000..0999}.tar",
+                                      "/data_storage/shared/datasets/laion-aesthetics-12m/{00000..00999}.tar"
+        ]
+        train_lm_shards_path_or_url: "/data_storage/shared/datasets/falcon-refinedweb/data/data/*.parquet"
+        add_caption_prompt: True
+        external_caption_path: "/data_storage/shared/datasets/SAM-LLaVA-Captions10M"
+        external_journeydb_caption_path: "/data_storage/shared/datasets/journeydb_anno/train_journeydb_anno.json"
+        external_laion12m_caption_path: "/data_storage/shared/datasets/laion-aesthetic-12m-captions"
+        external_cc12m_caption_path: "/data_storage/shared/datasets/cc12m/captions"
+        validation_prompts_file: "validation_prompts/imagenet_prompts.txt"
+        mmu_image_root: "/data_storage/ty/MMaDA/mmu_validation"
+        shuffle_buffer_size: 1000
+        num_workers: 32
+        resolution: 256
+        pin_memory: True
+        persistent_workers: True
+    preprocessing:
+        max_seq_length: 128 # for text tokens
+        resolution: 256
+        center_crop: False
+        random_flip: False
+optimizer:
+    name: adamw
+    params: # default adamw params
+        learning_rate: 1e-4
+        scale_lr: False # scale learning rate by total batch size
+        beta1: 0.9
+        beta2: 0.999
+        weight_decay: 0.01
+        epsilon: 1e-8
+lr_scheduler:
+    scheduler: "cosine"
+    params:
+        learning_rate: ${optimizer.params.learning_rate}
+        warmup_steps: 5000
+training:
+    gradient_accumulation_steps: 2
+    noise_type: "mask"
+    batch_size_t2i: 7
+    batch_size_lm: 2
+    batch_size_mmu: 6
+    mixed_precision: "bf16"
+    enable_tf32: True
+    seed: 10086
+    max_train_steps: 500000
+    overfit_one_batch: False
+    cond_dropout_prob: 0.1
+    min_masking_rate: 0.0
+    label_smoothing: 0.0
+    max_grad_norm: 1
+    guidance_scale: 1.5
+    generation_timesteps: 12
+    t2i_coeff: 1.0
+    lm_coeff: 0.1
+    mmu_coeff: 1.0

configs/mmada_pretraining_stage2_llada_instruct.yaml ADDED Viewed

	@@ -0,0 +1,109 @@

+wandb:
+  entity: null
+#  run_id: askkz9i2
+  resume: 'auto'
+experiment:
+    project: "mmada-training-stage2"
+    name: "mmada-training-stage2-llada-instruct"
+    output_dir: "mmada-training-stage2-llada-instruct"
+    max_train_examples_t2i: 40000000
+    max_train_examples_mmu: 40000000
+    save_every: 10000
+    eval_every: 2500
+    generate_every: 1000
+    log_every: 50
+    log_grad_norm_every: 100
+    resume_from_checkpoint: "latest"
+    val_every: 50
+    max_val_examples_t2i: 2000
+model:
+    vq_model:
+        type: "magvitv2"
+        vq_model_name: "showlab/magvitv2"
+    mmada:
+        tokenizer_path: "GSAI-ML/LLaDA-8B-Instruct"
+        pretrained_model_path: "path/to/your/checkpoint"
+        w_clip_vit: False
+        new_vocab_size: 134656
+        llm_vocab_size: 126464
+        codebook_size: 8192
+        num_vq_tokens: 256
+        num_new_special_tokens: 0
+        tie_word_embeddings: False
+    gradient_checkpointing: True
+dataset:
+    gen_type: "t2i"
+    und_type: "captioning"
+    combined_loader_mode: "max_size_cycle"
+    params:
+        train_t2i_shards_path_or_url: [ "/data_storage/shared/datasets/SA-1B/sa_{000000..000999}.tar",
+                                        "/data_storage/shared/datasets/cc12m/raw/raw/{0000..0999}.tar",
+                                        "/data_storage/shared/datasets/laion-aesthetics-12m/{00000..00999}.tar"
+        ]
+        train_mmu_shards_path_or_url: [ "/data_storage/shared/datasets/SA-1B/sa_{000000..000999}.tar",
+                                        "/data_storage/shared/datasets/cc12m/raw/raw/{0000..0999}.tar",
+                                      "/data_storage/shared/datasets/laion-aesthetics-12m/{00000..00999}.tar"
+        ]
+        train_lm_shards_path_or_url: "/data_storage/shared/datasets/falcon-refinedweb/data/data/*.parquet"
+        add_caption_prompt: True
+        external_caption_path: "/data_storage/shared/datasets/SAM-LLaVA-Captions10M"
+        external_journeydb_caption_path: "/data_storage/shared/datasets/journeydb_anno/train_journeydb_anno.json"
+        external_laion12m_caption_path: "/data_storage/ty/datasets/laion-aesthetics-12m-images-2"
+        external_cc12m_caption_path: "/data_storage/shared/datasets/cc12m/new_captions"
+        validation_prompts_file: "validation_prompts/text2image_prompts.txt"
+        mmu_image_root: "/data_storage/ty/MMaDA/mmu_validation"
+        shuffle_buffer_size: 1000
+        num_workers: 32
+        resolution: 256
+        pin_memory: True
+        persistent_workers: True
+    preprocessing:
+        max_seq_length: 256 # for text tokens
+        resolution: 256
+        center_crop: False
+        random_flip: False
+optimizer:
+    name: adamw
+    params: # default adamw params
+        learning_rate: 5e-5
+        scale_lr: False # scale learning rate by total batch size
+        beta1: 0.9
+        beta2: 0.999
+        weight_decay: 0.01
+        epsilon: 1e-8
+lr_scheduler:
+    scheduler: "cosine"
+    params:
+        learning_rate: ${optimizer.params.learning_rate}
+        warmup_steps: 5000
+        min_lr_scale: 0.1
+training:
+    gradient_accumulation_steps: 2
+    noise_type: "mask"
+    batch_size_t2i: 7
+    batch_size_lm: 2
+    batch_size_mmu: 3
+    mixed_precision: "bf16"
+    enable_tf32: True
+    seed: 10086
+    max_train_steps: 1000000
+    overfit_one_batch: False
+    cond_dropout_prob: 0.1
+    min_masking_rate: 0.0
+    label_smoothing: 0.0
+    max_grad_norm: 1
+    guidance_scale: 3
+    generation_timesteps: 12
+    t2i_coeff: 1.0
+    lm_coeff: 0.1
+    mmu_coeff: 0.5
+    validation_seed: 42

configs/mmada_pretraining_stage3_llada_instruct.yaml ADDED Viewed

	@@ -0,0 +1,112 @@

+wandb:
+  entity: null
+#  run_id: askkz9i2
+  resume: 'auto'
+experiment:
+    project: "mmada-training-stage3"
+    name: "mmada-training-stage3-llada-instruct"
+    output_dir: "mmada-training-stage3-llada-instruct"
+    max_train_examples_t2i: 40000000    #
+    max_train_examples_mmu: 40000000    #
+    save_every: 10000
+    eval_every: 2500
+    generate_every: 1000
+    log_every: 50
+    log_grad_norm_every: 100
+    resume_from_checkpoint: "latest"
+    val_every: 50
+    max_val_examples_t2i: 2000
+model:
+    vq_model:
+        type: "magvitv2"
+        vq_model_name: "showlab/magvitv2"
+    mmada:
+        tokenizer_path: "GSAI-ML/LLaDA-8B-Instruct"
+        pretrained_model_path: "path/to/your/checkpoint"
+        w_clip_vit: False
+        new_vocab_size: 134656
+        llm_vocab_size: 126464
+        codebook_size: 8192
+        num_vq_tokens: 256
+        num_new_special_tokens: 0
+        tie_word_embeddings: False
+    gradient_checkpointing: True
+dataset:
+    gen_type: "t2i"
+    und_type: "captioning"
+    combined_loader_mode: "max_size_cycle"
+    params:
+        train_t2i_shards_path_or_url: [     #
+                                        "/data_storage/shared/datasets/JourneyDB/train/imgs/data/train/imgs/{000..199}.tgz",
+                                        "/data_storage/shared/datasets/laion-aesthetics-12m/{00000..00999}.tar",
+                                        "/data_storage/shared/datasets/text-to-image-2M/data_512_2M"
+        ]
+        train_mmu_shards_path_or_url: [ "/data_storage/shared/datasets/SA-1B/sa_{000000..000999}.tar",  #
+                                        "/data_storage/shared/datasets/cc12m/raw/raw/{0000..0999}.tar",
+                                      "/data_storage/shared/datasets/laion-aesthetics-12m/{00000..00999}.tar"
+        ]
+        train_lm_shards_path_or_url: "/data_storage/ty/shared/datasets/3-instruct-datasets/parquet/*.parquet"
+        add_caption_prompt: True
+        external_caption_path: "/data_storage/shared/datasets/SAM-LLaVA-Captions10M"
+        external_journeydb_caption_path: "/data_storage/shared/datasets/journeydb_anno/train_journeydb_anno.json"
+        external_laion12m_caption_path: "/data_storage/ty/datasets/laion-aesthetics-12m-images-2"
+        external_cc12m_caption_path: "/data_storage/shared/datasets/cc12m/new_captions"
+        external_text_to_image_2M_512_caption_path: "/data_storage/shared/datasets/text-to-image-2M/data_512_2M_captions"
+        validation_prompts_file: "validation_prompts/text2image_prompts.txt"
+        mmu_image_root: "/data_storage/ty/MMaDA/mmu_validation"
+        lm_chat_validation_jsonl: "/data_storage/ty/MMaDA/lm_chat_validation/questions.jsonl"
+        shuffle_buffer_size: 1000
+        num_workers: 32
+        resolution: 512
+        pin_memory: True
+        persistent_workers: True
+    preprocessing:
+        max_seq_length: 512 # for text tokens   512
+        resolution: 512
+        center_crop: False
+        random_flip: False
+optimizer:
+    name: adamw
+    params: # default adamw params
+        learning_rate: 5e-5
+        scale_lr: False # scale learning rate by total batch size
+        beta1: 0.9
+        beta2: 0.999
+        weight_decay: 0.01
+        epsilon: 1e-8
+lr_scheduler:
+    scheduler: "cosine"
+    params:
+        learning_rate: ${optimizer.params.learning_rate}
+        warmup_steps: 5000
+        min_lr_scale: 0.1
+training:
+    gradient_accumulation_steps: 4  # 4
+    noise_type: "mask"
+    batch_size_t2i: 4   # 3~4
+    batch_size_lm: 1
+    batch_size_mmu: 1
+    mixed_precision: "bf16"
+    enable_tf32: True
+    seed: 10086
+    max_train_steps: 1000000
+    overfit_one_batch: False
+    cond_dropout_prob: 0.1
+    min_masking_rate: 0.0
+    label_smoothing: 0.0
+    max_grad_norm: 1
+    guidance_scale: 3
+    generation_timesteps: 12
+    t2i_coeff: 1.0
+    lm_coeff: 0.4 # ~0.5
+    mmu_coeff: 0.5
+    validation_seed: 42

configs/mmada_pretraining_stage3_llada_instruct_512_cot.yaml ADDED Viewed

	@@ -0,0 +1,123 @@

+wandb:
+  entity: null
+#  run_id: askkz9i2
+  resume: 'auto'
+experiment:
+    project: "mmada-training-stage3"
+    name: "mmada-training-stage3-llada-instruct-512-cot-uni"
+    output_dir: "mmada-training-stage3-llada-instruct-512-cot-uni"
+    max_train_examples_t2i: 40000000    #
+    max_train_examples_mmu: 40000000    #
+    save_every: 10000
+    eval_every: 2500
+    generate_every: 1000
+    log_every: 50
+    log_grad_norm_every: 100
+    # resume_from_checkpoint: False
+    resume_from_checkpoint: "latest"
+    val_every: 50
+    max_val_examples_t2i: 2000
+model:
+    vq_model:
+        type: "magvitv2"
+        vq_model_name: "showlab/magvitv2"
+    mmada:
+        tokenizer_path: "GSAI-ML/LLaDA-8B-Instruct"
+        pretrained_model_path: "path/to/your/checkpoint"
+        w_clip_vit: False
+        new_vocab_size: 134656
+        llm_vocab_size: 126464
+        codebook_size: 8192
+        num_vq_tokens: 1024
+        num_new_special_tokens: 0
+        tie_word_embeddings: False
+    gradient_checkpointing: True
+dataset:
+    gen_type: "t2i"
+    und_type: "captioning"
+    combined_loader_mode: "max_size_cycle"
+    params:
+        train_t2i_shards_path_or_url: [ "/data_storage/shared/datasets/JourneyDB/train/imgs/data/train/imgs/{000..199}.tgz",
+                                        "/data_storage/shared/datasets/laion-aesthetics-12m-filter/{00000..00999}.tar",
+                                        # "/data_storage/shared/datasets/text-to-image-2M/data_512_2M/data_{000000..000046}.tar"
+        ]
+        train_mmu_shards_path_or_url: [ "/data_storage/shared/datasets/multimodal_cot/ai2d/new_images.tar",
+                                        "/data_storage/shared/datasets/multimodal_cot/clevr/images.tar",
+                                        "/data_storage/shared/datasets/multimodal_cot/docvqa/images.tar",
+                                        "/data_storage/shared/datasets/multimodal_cot/geo/images.tar",
+                                        "/data_storage/shared/datasets/laion-aesthetics-12m/{00000..00999}.tar",
+        ]
+        train_lm_shards_path_or_url: "/data_storage/shared/datasets/3-cot-sft/parquet/*.parquet"
+        add_caption_prompt: True
+        external_caption_path: "/data_storage/shared/datasets/SAM-LLaVA-Captions10M"
+        external_journeydb_caption_path: "/data_storage/shared/datasets/journeydb_anno/train_journeydb_anno.json"
+        external_laion12m_caption_path: "/data_storage/ty/datasets/laion-aesthetics-12m-images-2"
+        external_cc12m_caption_path: "/data_storage/shared/datasets/cc12m/new_captions"
+        external_text_to_image_2M_512_caption_path: "/data_storage/shared/datasets/text-to-image-2M/data_512_2M_captions"
+        external_ai2d_caption_path: "/data_storage/shared/datasets/multimodal_cot/ai2d/new_metadata.csv"
+        external_clevr_caption_path: "/data_storage/shared/datasets/multimodal_cot/clevr/metadata.csv"
+        external_docvqa_caption_path: "/data_storage/shared/datasets/multimodal_cot/docvqa/metadata.csv"
+        external_geo_caption_path: "/data_storage/shared/datasets/multimodal_cot/geo/metadata.csv"
+        validation_prompts_file: "validation_prompts/text2image_prompts.txt"
+        mmu_image_root: "/data_storage/ty/MMaDA/mmu_validation"
+        mmu_validation_prompts_file: "/data_storage/ty/MMaDA/mmu_validation/prompts.jsonl"
+        lm_chat_validation_jsonl: "/data_storage/ty/MMaDA/lm_chat_validation/questions.jsonl"
+        shuffle_buffer_size: 1000
+        num_workers: 32
+        resolution: 512
+        pin_memory: True
+        persistent_workers: True
+    preprocessing:
+        max_seq_length: 512 # for text tokens in t2i & mmu
+        max_lm_text_length: 1536 # for text tokens in lm/lm_chat
+        resolution: 512
+        center_crop: False
+        random_flip: False
+optimizer:
+    name: adamw
+    params: # default adamw params
+        learning_rate: 5e-5
+        scale_lr: False # scale learning rate by total batch size
+        beta1: 0.9
+        beta2: 0.999
+        weight_decay: 0.01
+        epsilon: 1e-8
+lr_scheduler:
+    scheduler: "cosine"
+    params:
+        learning_rate: ${optimizer.params.learning_rate}
+        warmup_steps: 5000
+        min_lr_scale: 0.1
+training:
+    gradient_accumulation_steps: 4  # 4
+    noise_type: "mask"
+    batch_size_t2i: 1
+    batch_size_lm: 2
+    batch_size_mmu: 1
+    mixed_precision: "bf16"
+    enable_tf32: True
+    seed: 10086
+    max_train_steps: 1000000
+    overfit_one_batch: False
+    cond_dropout_prob: 0.1
+    min_masking_rate: 0.0
+    label_smoothing: 0.0
+    max_grad_norm: 1
+    guidance_scale: 5
+    generation_timesteps: 20
+    t2i_coeff: 1.0
+    lm_coeff: 0.5
+    mmu_coeff: 0.5
+validation:
+    quantative_prompts_file: "/data_storage/ty/MMaDA/validation_prompts/quantative.txt"
+    quantative_batch_size: 8

configs/mmada_pretraining_stage4_llada_instruct.yaml ADDED Viewed

	@@ -0,0 +1,134 @@

+wandb:
+  entity: null
+#  run_id: askkz9i2
+  resume: 'auto'
+experiment:
+    project: "mmada-training-stage4"
+    name: "mmada-training-stage4-llada-instruct"
+    output_dir: "mmada-training-stage4-llada-instruct"
+    max_train_examples_t2i: 40000000    #
+    max_train_examples_mmu: 40000000    #
+    save_every: 10000
+    eval_every: 2500
+    generate_every: 1000
+    log_every: 50
+    log_grad_norm_every: 100
+    resume_from_checkpoint: "latest"
+    val_every: 50
+    max_val_examples_t2i: 2000
+model:
+    vq_model:
+        type: "magvitv2"
+        vq_model_name: "showlab/magvitv2"
+    mmada:
+        tokenizer_path: "GSAI-ML/LLaDA-8B-Instruct"
+        pretrained_model_path: "/data_storage/ty/MMaDA/mmada-training-stage3-llada-instruct-512-cot-uni/checkpoint-210000/unwrapped_model"
+        w_clip_vit: False
+        new_vocab_size: 134656
+        llm_vocab_size: 126464
+        codebook_size: 8192
+        num_vq_tokens: 1024
+        num_new_special_tokens: 0
+        tie_word_embeddings: False
+    gradient_checkpointing: True
+dataset:
+    gen_type: "t2i"
+    und_type: "captioning"
+    combined_loader_mode: "max_size_cycle"
+    params:
+        train_t2i_shards_path_or_url: [ "/data_storage/shared/datasets/JourneyDB/train/imgs/data/train/imgs/{000..199}.tgz",
+                                        "/data_storage/shared/datasets/laion-aesthetics-12m-filter/{00000..00999}.tar",
+                                        # "/data_storage/shared/datasets/text-to-image-2M/data_512_2M/data_{000000..000046}.tar"
+        ]
+        train_mmu_shards_path_or_url: [ "/data_storage/shared/datasets/multimodal_cot/ai2d/new_images.tar",
+                                        "/data_storage/shared/datasets/multimodal_cot/clevr/images.tar",
+                                        "/data_storage/shared/datasets/multimodal_cot/docvqa/images.tar",
+                                        "/data_storage/shared/datasets/multimodal_cot/geo/images.tar",
+        ]
+        train_lm_shards_path_or_url: "/data_storage/shared/datasets/falcon-refinedweb/data/data/*.parquet"
+        train_instruct_shards_path_or_url: "/data_storage/shared/datasets/stage4_instruct/*.parquet"
+        add_caption_prompt: True
+        external_caption_path: "/data_storage/shared/datasets/SAM-LLaVA-Captions10M"
+        external_journeydb_caption_path: "/data_storage/shared/datasets/journeydb_anno/train_journeydb_anno.json"
+        external_laion12m_caption_path: "/data_storage/ty/datasets/laion-aesthetics-12m-images-2"
+        external_cc12m_caption_path: "/data_storage/shared/datasets/cc12m/new_captions"
+        external_text_to_image_2M_512_caption_path: "/data_storage/shared/datasets/text-to-image-2M/data_512_2M_captions"
+        external_ai2d_caption_path: "/data_storage/shared/datasets/multimodal_cot/ai2d/new_metadata.csv"
+        external_clevr_caption_path: "/data_storage/shared/datasets/multimodal_cot/clevr/metadata.csv"
+        external_docvqa_caption_path: "/data_storage/shared/datasets/multimodal_cot/docvqa/metadata.csv"
+        external_geo_caption_path: "/data_storage/shared/datasets/multimodal_cot/geo/metadata.csv"
+        external_vqa_caption_path: "/data_storage/shared/datasets/LLaVA-Instruct-150K/llava_v1_5_mix665k.json"
+        external_clevr2_caption_path: "/data_storage/ty/datasets/Clevr_CoGenT_TrainA_70K_Complex/captions.json"
+        external_geo170k_caption_path: "/data_storage/ty/shared/datasets/Geo170K/Geo170K/all.json"
+        vqa_images_path: "/data_storage/shared/datasets/LLaVA-Instruct-150K-images"
+        clevr2_images_path: "/data_storage/ty/datasets/Clevr_CoGenT_TrainA_70K_Complex/images"
+        geo170k_images_path: "/data_storage/ty/shared/datasets/Geo170K/Geo170K/images"
+        validation_prompts_file: "validation_prompts/text2image_prompts.txt"
+        mmu_image_root: "/data_storage/ty/MMaDA/mmu_validation"
+        mmu_validation_prompts_file: "/data_storage/ty/MMaDA/mmu_validation/prompts_with_vqa.json"
+        lm_chat_validation_jsonl: "/data_storage/ty/MMaDA/lm_chat_validation/questions.jsonl"
+        shuffle_buffer_size: 1000
+        num_workers: 16
+        resolution: 512
+        pin_memory: True
+        persistent_workers: True
+    preprocessing:
+        max_seq_length: 512 # for text tokens in t2i & mmu
+        max_lm_text_length: 1536 # for text tokens in lm/lm_chat
+        resolution: 512
+        center_crop: False
+        random_flip: False
+optimizer:
+    name: adamw
+    params: # default adamw params
+        learning_rate: 5e-5
+        scale_lr: False # scale learning rate by total batch size
+        beta1: 0.9
+        beta2: 0.999
+        weight_decay: 0.01
+        epsilon: 1e-8
+lr_scheduler:
+    scheduler: "cosine"
+    params:
+        learning_rate: ${optimizer.params.learning_rate}
+        warmup_steps: 5000
+        min_lr_scale: 0.1
+training:
+    gradient_accumulation_steps: 4  # 4
+    noise_type: "mask"
+    batch_size_t2i: 1
+    batch_size_lm: 2
+    batch_size_mmu: 1
+    mixed_precision: "bf16"
+    enable_tf32: True
+    seed: 10086
+    max_train_steps: 1000000
+    overfit_one_batch: False
+    cond_dropout_prob: 0.1
+    min_masking_rate: 0.0
+    label_smoothing: 0.0
+    max_grad_norm: 1
+    guidance_scale: 5
+    generation_timesteps: 20
+    t2i_coeff: 0.05
+    lm_coeff: 0.6
+    mmu_coeff: 0.4
+    cot_in_mmu_coeff: 3.5
+    vqa_in_mmu_coeff: 5.5
+    clevr2_in_mmu_coeff: 0.5
+    geo170k_in_mmu_coeff: 0.5
+    base_in_lm_coeff: 0.02
+    instruct_in_lm_coeff: 0.98
+validation:
+    quantative_prompts_file: "/data_storage/ty/MMaDA/validation_prompts/quantative.txt"
+    quantative_batch_size: 8

generate.py ADDED Viewed

	@@ -0,0 +1,131 @@

+import torch
+import numpy as np
+import torch.nn.functional as F
+from transformers import AutoTokenizer, AutoModel
+from models import MMadaModelLM
+def add_gumbel_noise(logits, temperature):
+    '''
+    The Gumbel max is a method for sampling categorical distributions.
+    According to arXiv:2409.02908, for MDM, low-precision Gumbel Max improves perplexity score but reduces generation quality.
+    Thus, we use float64.
+    '''
+    if temperature == 0:
+        return logits
+    logits = logits.to(torch.float64)
+    noise = torch.rand_like(logits, dtype=torch.float64)
+    gumbel_noise = (- torch.log(noise)) ** temperature
+    return logits.exp() / gumbel_noise
+def get_num_transfer_tokens(mask_index, steps):
+    '''
+    In the reverse process, the interval [0, 1] is uniformly discretized into steps intervals.
+    Furthermore, because LLaDA employs a linear noise schedule (as defined in Eq. (8)),
+    the expected number of tokens transitioned at each step should be consistent.
+    This function is designed to precompute the number of tokens that need to be transitioned at each step.
+    '''
+    mask_num = mask_index.sum(dim=1, keepdim=True)
+    base = mask_num // steps
+    remainder = mask_num % steps
+    num_transfer_tokens = torch.zeros(mask_num.size(0), steps, device=mask_index.device, dtype=torch.int64) + base
+    for i in range(mask_num.size(0)):
+        num_transfer_tokens[i, :remainder[i]] += 1
+    return num_transfer_tokens
+@ torch.no_grad()
+def generate(model, prompt, steps=128, gen_length=128, block_length=128, temperature=0.,
+             cfg_scale=0., remasking='low_confidence', mask_id=126336, attention_mask=None):
+    '''
+    Args:
+        model: Mask predictor.
+        prompt: A tensor of shape (B, L), where B is batch size.
+        steps: Sampling steps, less than or equal to gen_length.
+        gen_length: Generated answer length.
+        block_length: Block length, less than or equal to gen_length. If less than gen_length, it means using semi_autoregressive remasking.
+        temperature: Categorical distribution sampling temperature.
+        cfg_scale: Unsupervised classifier-free guidance scale.
+        remasking: Remasking strategy. 'low_confidence' or 'random'.
+        mask_id: The toke id of [MASK] is 126336.
+    '''
+    if attention_mask is not None and 0.0 in attention_mask:
+        attention_bias = (attention_mask[:, :, None] & attention_mask[:, None, :]).bool().unsqueeze(1)
+        print(f"attention_bias: {attention_bias}")
+    else:
+        attention_bias = None
+    batch_size = prompt.shape[0]
+    x = torch.full((batch_size, prompt.shape[1] + gen_length), mask_id, dtype=torch.long).to(model.device)
+    x[:, :prompt.shape[1]] = prompt.clone()
+    prompt_index = (x != mask_id)
+    assert gen_length % block_length == 0
+    num_blocks = gen_length // block_length
+    assert steps % num_blocks == 0
+    steps = steps // num_blocks
+    for num_block in range(num_blocks):
+        block_mask_index = (x[:, prompt.shape[1] + num_block * block_length: prompt.shape[1] + (num_block + 1) * block_length:] == mask_id)
+        num_transfer_tokens = get_num_transfer_tokens(block_mask_index, steps)
+        for i in range(steps):
+            mask_index = (x == mask_id)
+            if cfg_scale > 0.:
+                un_x = x.clone()
+                un_x[prompt_index] = mask_id
+                x_ = torch.cat([x, un_x], dim=0)
+                logits = model(x_).logits
+                logits, un_logits = torch.chunk(logits, 2, dim=0)
+                logits = un_logits + (cfg_scale + 1) * (logits - un_logits)
+            else:
+                logits = model(x, attention_bias=attention_bias).logits
+            logits_with_noise = add_gumbel_noise(logits, temperature=temperature)
+            x0 = torch.argmax(logits_with_noise, dim=-1) # b, l
+            if remasking == 'low_confidence':
+                p = F.softmax(logits.to(torch.float64), dim=-1)
+                x0_p = torch.squeeze(
+                    torch.gather(p, dim=-1, index=torch.unsqueeze(x0, -1)), -1) # b, l
+            elif remasking == 'random':
+                x0_p = torch.rand((x0.shape[0], x0.shape[1]), device=x0.device)
+            else:
+                raise NotImplementedError(remasking)
+            x0_p[:, prompt.shape[1] + (num_block + 1) * block_length:] = -np.inf
+            x0 = torch.where(mask_index, x0, x)
+            confidence = torch.where(mask_index, x0_p, -np.inf)
+            # print(confidence.shape)
+            transfer_index = torch.zeros_like(x0, dtype=torch.bool, device=x0.device)
+            for j in range(confidence.shape[0]):
+                _, select_index = torch.topk(confidence[j], k=num_transfer_tokens[j, i])
+                transfer_index[j, select_index] = True
+            x[transfer_index] = x0[transfer_index]
+    return x
+def main():
+    device = 'cuda'
+    model = MMadaModelLM.from_pretrained("/data_storage/ty/MMaDA/mmada-training-stage4-llada-instruct/checkpoint-170000/unwrapped_model", trust_remote_code=True, torch_dtype=torch.bfloat16).to(device).eval()
+    tokenizer = AutoTokenizer.from_pretrained("/data_storage/ty/MMaDA/mmada-training-stage4-llada-instruct/checkpoint-170000/unwrapped_model", trust_remote_code=True)
+    tokenizer.chat_template = "{% set loop_messages = messages %}{% for message in loop_messages %}{% set content = '<|start_header_id|>' + message['role'] + '<|end_header_id|>\n'+ message['content'] | trim + '<|eot_id|>' %}{% if loop.index0 == 0 %}{% set content = bos_token + content %}{% endif %}{{ content }}{% endfor %}{{ '<|start_header_id|>assistant<|end_header_id|>\n' }}"
+    prompt = "Lily can run 12 kilometers per hour for 4 hours. After that, she runs 6 kilometers per hour. How many kilometers can she run in 8 hours?"
+    m = [{"role": "user", "content": prompt}, ]
+    prompt = tokenizer.apply_chat_template(m, add_generation_prompt=True, tokenize=False)
+    input_ids = tokenizer(text=prompt, return_tensors="pt", padding=True, padding_side="left")['input_ids']
+    input_ids = torch.tensor(input_ids).to(device)
+    out = generate(model, input_ids, steps=128, gen_length=128, block_length=128, temperature=1, cfg_scale=0., remasking='low_confidence')
+    print(tokenizer.batch_decode(out[:, input_ids.shape[1]:], skip_special_tokens=True))
+if __name__ == '__main__':
+    main()

inference_mmu.py ADDED Viewed

	@@ -0,0 +1,114 @@

+# coding=utf-8
+# Copyright 2025 MMaDA Team
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+#     http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+import os
+os.environ["TOKENIZERS_PARALLELISM"] = "true"
+from PIL import Image
+from tqdm import tqdm
+import numpy as np
+import torch
+import wandb
+from models import MAGVITv2, MMadaConfig, MMadaModelLM
+from training.prompting_utils import UniversalPrompting
+from training.utils import get_config, flatten_omega_conf, image_transform
+from transformers import AutoTokenizer, AutoConfig
+def resize_vocab(model, config):
+    print(f"Resizing token embeddings to {config.new_vocab_size}")
+    model.resize_token_embeddings(config.new_vocab_size)
+def get_vq_model_class(model_type):
+    if model_type == "magvitv2":
+        return MAGVITv2
+    else:
+        raise ValueError(f"model_type {model_type} not supported.")
+if __name__ == '__main__':
+    config = get_config()
+    resume_wandb_run = config.wandb.resume
+    run_id = config.wandb.get("run_id", None)
+    if run_id is None:
+        resume_wandb_run = False
+        run_id = wandb.util.generate_id()
+        config.wandb.run_id = run_id
+    wandb_config = {k: v for k, v in flatten_omega_conf(config, resolve=True)}
+    wandb.init(
+        project="demo",
+        name=config.experiment.name + '_mmu',
+        config=wandb_config,
+    )
+    device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
+    tokenizer = AutoTokenizer.from_pretrained(config.model.mmada.pretrained_model_path, padding_side="left")
+    uni_prompting = UniversalPrompting(tokenizer, max_text_len=config.dataset.preprocessing.max_seq_length,
+                                       special_tokens=("<|soi|>", "<|eoi|>", "<|sov|>", "<|eov|>", "<|t2i|>", "<|mmu|>", "<|t2v|>", "<|v2v|>", "<|lvg|>"),
+                                       ignore_id=-100, cond_dropout_prob=config.training.cond_dropout_prob, use_reserved_token=True)
+    vq_model = get_vq_model_class(config.model.vq_model.type)
+    vq_model = vq_model.from_pretrained(config.model.vq_model.vq_model_name).to(device)
+    vq_model.requires_grad_(False)
+    vq_model.eval()
+    model = MMadaModelLM.from_pretrained(config.model.mmada.pretrained_model_path, trust_remote_code=True, torch_dtype=torch.bfloat16)
+    model.to(device)
+    mask_token_id = model.config.mask_token_id
+    temperature = 0.8  # 1.0 = no change, < 1.0 = less random, > 1.0 = more random, in predictions
+    top_k = 1  # retain only the top_k most likely tokens, clamp others to have 0 probability
+    file_list = os.listdir(config.mmu_image_root)
+    file_list = [f for f in file_list if f.lower().endswith(('.jpg', '.png', '.jpeg'))]
+    responses = ['' for i in range(len(file_list))]
+    images = []
+    config.question = config.question.split(' *** ')
+    for i, file_name in enumerate(tqdm(file_list)):
+        image_path = os.path.join(config.mmu_image_root, file_name)
+        image_ori = Image.open(image_path).convert("RGB")
+        image = image_transform(image_ori, resolution=config.dataset.params.resolution).to(device)
+        image = image.unsqueeze(0)
+        images.append(image)
+        image_tokens = vq_model.get_code(image) + len(uni_prompting.text_tokenizer)
+        batch_size = 1
+        for question in config.question:
+            input_ids = uni_prompting.text_tokenizer(['<|start_header_id|>user<|end_header_id|>\n' + "Please describe this image in detail."  +'<eot_id><|start_header_id|>assistant<|end_header_id|>\n'])['input_ids']
+            input_ids = torch.tensor(input_ids).to(device)
+            input_ids = torch.cat([
+                (torch.ones(input_ids.shape[0], 1) * uni_prompting.sptids_dict['<|mmu|>']).to(device),
+                (torch.ones(input_ids.shape[0], 1) * uni_prompting.sptids_dict['<|soi|>']).to(device),
+                image_tokens,
+                (torch.ones(input_ids.shape[0], 1) * uni_prompting.sptids_dict['<|eoi|>']).to(device),
+                (torch.ones(input_ids.shape[0], 1) * uni_prompting.sptids_dict['<|sot|>']).to(device),
+                input_ids
+            ], dim=1).long()
+            output_ids = model.mmu_generate(input_ids, max_new_tokens=1024, steps=512, block_length=1024)
+            text = uni_prompting.text_tokenizer.batch_decode(output_ids[:, input_ids.shape[1]:], skip_special_tokens=True)
+            print(text)
+            responses[i] += f'User: ' + question + f'\n Answer : ' + text[0] + '\n'
+    images = torch.cat(images, dim=0)
+    images = torch.clamp((images + 1.0) / 2.0, min=0.0, max=1.0)
+    images *= 255.0
+    images = images.permute(0, 2, 3, 1).cpu().numpy().astype(np.uint8)
+    pil_images = [Image.fromarray(image) for image in images]
+    wandb_images = [wandb.Image(image, caption=responses[i]) for i, image in enumerate(pil_images)]
+    wandb.log({"multimodal understanding": wandb_images}, step=0)

inference_t2i.py ADDED Viewed

	@@ -0,0 +1,129 @@

+# coding=utf-8
+# Copyright 2025 MMaDA Team
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+#     http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+import os
+import inspect
+os.environ["TOKENIZERS_PARALLELISM"] = "true"
+from PIL import Image
+from tqdm import tqdm
+import numpy as np
+import torch
+import wandb
+from models import MAGVITv2, get_mask_schedule, MMadaModelLM, MMadaConfig
+from training.prompting_utils import UniversalPrompting
+from training.utils import get_config, flatten_omega_conf, image_transform
+from transformers import AutoTokenizer, AutoConfig, AutoModel
+import torch.nn.functional as F
+def resize_vocab(model, config):
+    print(f"Resizing token embeddings to {config.new_vocab_size}")
+    model.resize_token_embeddings(config.new_vocab_size)
+def get_vq_model_class(model_type):
+    if model_type == "magvitv2":
+        return MAGVITv2
+    else:
+        raise ValueError(f"model_type {model_type} not supported.")
+if __name__ == '__main__':
+    config = get_config()
+    resume_wandb_run = config.wandb.resume
+    run_id = config.wandb.get("run_id", None)
+    if run_id is None:
+        resume_wandb_run = False
+        run_id = wandb.util.generate_id()
+        config.wandb.run_id = run_id
+    wandb_config = {k: v for k, v in flatten_omega_conf(config, resolve=True)}
+    wandb.init(
+        project="demo",
+        name=config.experiment.name + '_t2i',
+        config=wandb_config,
+    )
+    device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
+    tokenizer = AutoTokenizer.from_pretrained(config.model.mmada.pretrained_model_path, padding_side="left")
+    uni_prompting = UniversalPrompting(tokenizer, max_text_len=config.dataset.preprocessing.max_seq_length, special_tokens=("<|soi|>", "<|eoi|>", "<|sov|>", "<|eov|>", "<|t2i|>", "<|mmu|>", "<|t2v|>", "<|v2v|>", "<|lvg|>"),ignore_id=-100, cond_dropout_prob=config.training.cond_dropout_prob, use_reserved_token=True)
+    vq_model = get_vq_model_class(config.model.vq_model.type)
+    vq_model = vq_model.from_pretrained(config.model.vq_model.vq_model_name).to(device)
+    vq_model.requires_grad_(False)
+    vq_model.eval()
+    model = MMadaModelLM.from_pretrained(config.model.mmada.pretrained_model_path, trust_remote_code=True, torch_dtype=torch.bfloat16)
+    model.to(device)
+    mask_token_id = model.config.mask_token_id
+    if config.get("validation_prompts_file", None) is not None:
+        config.dataset.params.validation_prompts_file = config.validation_prompts_file
+    config.training.batch_size = config.batch_size
+    config.training.guidance_scale = config.guidance_scale
+    config.training.generation_timesteps = config.generation_timesteps
+    with open(config.dataset.params.validation_prompts_file, "r") as f:
+        validation_prompts = f.read().splitlines()
+    for step in tqdm(range(0, len(validation_prompts), config.training.batch_size)):
+        prompts = validation_prompts[step:step + config.training.batch_size]
+        image_tokens = torch.ones((len(prompts), config.model.mmada.num_vq_tokens),
+                                    dtype=torch.long, device=device) * mask_token_id
+        input_ids, attention_mask = uni_prompting((prompts, image_tokens), 't2i_gen')
+        if config.training.guidance_scale > 0:
+            uncond_input_ids, uncond_attention_mask = uni_prompting(([''] * len(prompts), image_tokens), 't2i_gen')
+        else:
+            uncond_input_ids = None
+            uncond_attention_mask = None
+        if config.get("mask_schedule", None) is not None:
+            schedule = config.mask_schedule.schedule
+            args = config.mask_schedule.get("params", {})
+            mask_schedule = get_mask_schedule(schedule, **args)
+        else:
+            mask_schedule = get_mask_schedule(config.training.get("mask_schedule", "cosine"))
+        with torch.no_grad():
+            gen_token_ids = model.t2i_generate(
+                input_ids=input_ids,
+                uncond_input_ids=uncond_input_ids,
+                attention_mask=attention_mask,
+                uncond_attention_mask=uncond_attention_mask,
+                guidance_scale=config.training.guidance_scale,
+                temperature=config.training.get("generation_temperature", 1.0),
+                timesteps=config.training.generation_timesteps,
+                noise_schedule=mask_schedule,
+                noise_type=config.training.get("noise_type", "mask"),
+                seq_len=config.model.mmada.num_vq_tokens,
+                uni_prompting=uni_prompting,
+                config=config,
+            )
+        gen_token_ids = torch.clamp(gen_token_ids, max=config.model.mmada.codebook_size - 1, min=0)
+        images = vq_model.decode_code(gen_token_ids)
+        images = torch.clamp((images + 1.0) / 2.0, min=0.0, max=1.0)
+        images *= 255.0
+        images = images.permute(0, 2, 3, 1).cpu().numpy().astype(np.uint8)
+        pil_images = [Image.fromarray(image) for image in images]
+        wandb_images = [wandb.Image(image, caption=prompts[i]) for i, image in enumerate(pil_images)]
+        wandb.log({"generated_images": wandb_images}, step=step)

lm_chat_validation/description.txt ADDED Viewed

	@@ -0,0 +1,5 @@

+<|start_header_id|>user<|end_header_id|>
+From the following items, select the one that belongs to animals:
+1. Apple
+2. Sun
+3. Dog<eot_id><|start_header_id|>assistant<|end_header_id|>

lm_chat_validation/questions.jsonl ADDED Viewed

	@@ -0,0 +1,11 @@

+{"question":"Write a short poem with the theme of the sea."}
+{"question":"From the following items, select the one that belongs to animals:\n1. Apple\n2. Sun\n3. Dog"}
+{"question":"Please answer the following question based on the context provided.\nContext: \nGood Friday is a Christian holiday commemorating the crucifixion of Jesus and his death at Calvary. It is observed during Holy Week as part of the Paschal Triduum. It is also known as Holy Friday, Great Friday, Great and Holy Friday (also Holy and Great Friday), and Black Friday.\nQuestion: \nExtract the various ways to say Good Friday from the text. Separate them with a new line."}
+{"question":"Write a speech introducing yourself to the audience."}
+{"question":"Please answer the following question based on the context provided.\nContext:\nThe Maurice \"Rocket\" Richard Trophy, also known as the Rocket Richard Trophy, is awarded annually to the leading goal scorer in the National Hockey League (NHL). It was donated to the NHL by the Montreal Canadiens in 1998–99 and is named in honour of legendary Montreal Canadiens right winger Maurice \"Rocket\" Richard. First won by Teemu Selanne, it is currently held by Auston Matthews, who scored 60 goals during the 2021–22 NHL season.\nQuestion:\nWhat is the Maurice Richard Trophy"}
+{"question":"Explain what an embedding layer is and its purpose in Machine Learning."}
+{"question":"You should first think about the reasoning process in the mind and then provide the user with the answer. The reasoning process is enclosed within <think> </think> tags, i.e. <think> reasoning process here </think> answer here\nA rectangular prism has a length of 5 units, a width of 4 units, and a height of 3 units. What is the volume of the prism?\n"}
+{"question":"You should first think about the reasoning process in the mind and then provide the user with the answer. The reasoning process is enclosed within <think> </think> tags, i.e. <think> reasoning process here </think> answer here\nEvaluate $ (1 + i)^4 $.\n"}
+{"question":"You should first think about the reasoning process in the mind and then provide the user with the answer. The reasoning process is enclosed within <think> </think> tags, i.e. <think> reasoning process here </think> answer here\nGiven $\\tan\\beta= \\frac {1}{2}$, find the value of $\\sin^2\\beta-3\\sin\\beta\\cos\\beta+4\\cos^2\\beta$.\n"}
+{"question":"You should first think about the reasoning process in the mind and then provide the user with the answer. The reasoning process is enclosed within <think> </think> tags, i.e. <think> reasoning process here </think> answer here\nJames has 7 apples. 4 of them are red, and 3 of them are green. If he chooses 2 apples at random, what is the probability that both the apples he chooses are green?\n"}
+{"question":"You should first think about the reasoning process in the mind and then provide the user with the answer. The reasoning process is enclosed within <think> </think> tags, i.e. <think> reasoning process here </think> answer here\nThe user will describe something indirectly, and you need to infer and answer what that thing is (without any explanation). If there are multiple possible answers, choose one of them.\nThe thing: A staple food in many Asian countries\n"}

mmu_validation/Decoupling Visual Encoding.png ADDED Viewed

Git LFS Details

SHA256: 646e6bdf94ec798ad69f826095571897ebe2e4c5280e3f1080ed80f979978a39
Pointer size: 131 Bytes
Size of remote file: 248 kB

mmu_validation/ai2d.png ADDED Viewed

Git LFS Details

SHA256: 885f38bc9cfdc6ecccf0d80eb3a2a9a91be5ef8e5ae6fbde6f1179b443808a4c
Pointer size: 131 Bytes
Size of remote file: 389 kB

mmu_validation/clevr.jpg ADDED Viewed

mmu_validation/docvqa.png ADDED Viewed

mmu_validation/dog.png ADDED Viewed

mmu_validation/geo.jpg ADDED Viewed

mmu_validation/llava1.jpg ADDED Viewed

Git LFS Details

SHA256: 8b38a0a97dc7cef8ea664a5541a8e460887ce4df059835240a279fce82d7b635
Pointer size: 131 Bytes
Size of remote file: 189 kB

mmu_validation/llava2.jpg ADDED Viewed

mmu_validation/prompts.jsonl ADDED Viewed

	@@ -0,0 +1,10 @@

+{"file_name": "clevr.jpg", "prompt": "<|start_header_id|>user<|end_header_id|>\nYou should first think about the reasoning process in the mind and then provide the user with the answer. The reasoning process is enclosed within <think> </think> tags, i.e. <think> reasoning process here </think> answer here\nHow many objects are there in total in this picture?<eot_id><|start_header_id|>assistant<|end_header_id|>\n"}
+{"file_name": "geo.jpg", "prompt": "<|start_header_id|>user<|end_header_id|>\nYou should first think about the reasoning process in the mind and then provide the user with the answer. The reasoning process is enclosed within <think> </think> tags, i.e. <think> reasoning process here </think> answer here\nAs shown in the figure, in ABCD, angle ADC = 135° and angle CAD = 23°, then angle CAB is equal to ().<eot_id><|start_header_id|>assistant<|end_header_id|>\n"}
+{"file_name": "docvqa.png", "prompt": "<|start_header_id|>user<|end_header_id|>\nYou should first think about the reasoning process in the mind and then provide the user with the answer. The reasoning process is enclosed within <think> </think> tags, i.e. <think> reasoning process here </think> answer here\nWhat is written in first rectangle at the top of the page?.<eot_id><|start_header_id|>assistant<|end_header_id|>\n"}
+{"file_name": "ai2d.png", "prompt": "<|start_header_id|>user<|end_header_id|>\nYou should first think about the reasoning process in the mind and then provide the user with the answer. The reasoning process is enclosed within <think> </think> tags, i.e. <think> reasoning process here </think> answer here\nAccording to the given food web, what will be the result of decrease in phytoplanktons?\nOptions:\n0: The planktivores will increase\n1: Decrease in zooplankton\n2: Increase in adult game fish\n3: The detritivores will lose its energy.\nPlease choose and answer with only the index number (0, 1, 2, or 3).<eot_id><|start_header_id|>assistant<|end_header_id|>\n"}
+{"file_name": "dog.png", "prompt": "<|start_header_id|>user<|end_header_id|>\nPlease describe this image in detail.<eot_id><|start_header_id|>assistant<|end_header_id|>\n"}
+{"file_name": "sofa_under_water.jpg", "prompt": "<|start_header_id|>user<|end_header_id|>\nPlease describe this image in detail.<eot_id><|start_header_id|>assistant<|end_header_id|>\n"}
+{"file_name": "sunflower.jpg", "prompt": "<|start_header_id|>user<|end_header_id|>\nPlease describe this image in detail.<eot_id><|start_header_id|>assistant<|end_header_id|>\n"}
+{"file_name": "woman.jpg", "prompt": "<|start_header_id|>user<|end_header_id|>\nPlease describe this image in detail.<eot_id><|start_header_id|>assistant<|end_header_id|>\n"}
+{"file_name": "llava1.jpg", "prompt": "<|start_header_id|>user<|end_header_id|>\nPlease describe this image in detail.<eot_id><|start_header_id|>assistant<|end_header_id|>\n"}
+{"file_name": "llava2.jpg", "prompt": "<|start_header_id|>user<|end_header_id|>\nPlease describe this image in detail.<eot_id><|start_header_id|>assistant<|end_header_id|>\n"}

mmu_validation/prompts_with_vqa.json ADDED Viewed

	@@ -0,0 +1,116 @@

+[
+    {
+        "file_name": "clevr.jpg",
+        "messages": [
+            {
+                "role": "user",
+                "content": "You should first think about the reasoning process in the mind and then provide the user with the answer. The reasoning process is enclosed within <think> </think> tags, i.e. <think> reasoning process here </think> answer here\nHow many objects are there in total in this picture?"
+            }
+        ]
+    },
+    {
+        "file_name": "geo.jpg",
+        "messages": [
+            {
+                "role": "user",
+                "content": "You should first think about the reasoning process in the mind and then provide the user with the answer. The reasoning process is enclosed within <think> </think> tags, i.e. <think> reasoning process here </think> answer here\nAs shown in the figure, in ABCD, angle ADC = 135° and angle CAD = 23°, then angle CAB is equal to ()."
+            }
+        ]
+    },
+    {
+        "file_name": "docvqa.png",
+        "messages": [
+            {
+                "role": "user",
+                "content": "You should first think about the reasoning process in the mind and then provide the user with the answer. The reasoning process is enclosed within <think> </think> tags, i.e. <think> reasoning process here </think> answer here\nWhat is written in first rectangle at the top of the page?."
+            }
+        ]
+    },
+    {
+        "file_name": "ai2d.png",
+        "messages": [
+            {
+                "role": "user",
+                "content": "You should first think about the reasoning process in the mind and then provide the user with the answer. The reasoning process is enclosed within <think> </think> tags, i.e. <think> reasoning process here </think> answer here\nAccording to the given food web, what will be the result of decrease in phytoplanktons?\nOptions:\n0: The planktivores will increase\n1: Decrease in zooplankton\n2: Increase in adult game fish\n3: The detritivores will lose its energy.\nPlease choose and answer with only the index number (0, 1, 2, or 3)."
+            }
+        ]
+    },
+    {
+        "file_name": "dog.png",
+        "messages": [
+            {
+                "role": "user",
+                "content": "Please describe this image in detail."
+            }
+        ]
+    },
+    {
+        "file_name": "sofa_under_water.jpg",
+        "messages": [
+            {
+                "role": "user",
+                "content": "Please describe this image in detail."
+            }
+        ]
+    },
+    {
+        "file_name": "sunflower.jpg",
+        "messages": [
+            {
+                "role": "user",
+                "content": "Please describe this image in detail."
+            }
+        ]
+    },
+    {
+        "file_name": "woman.jpg",
+        "messages": [
+            {
+                "role": "user",
+                "content": "Please describe this image in detail."
+            }
+        ]
+    },
+    {
+        "file_name": "llava1.jpg",
+        "messages": [
+            {
+                "role": "user",
+                "content": "What are the colors of the bus in the image?"
+            },
+            {
+                "role": "assistant",
+                "content": "The bus in the image is white and red."
+            },
+            {
+                "role": "user",
+                "content": "What feature can be seen on the back of the bus?"
+            }
+        ]
+    },
+    {
+        "file_name": "llava2.jpg",
+        "messages": [
+            {
+                "role": "user",
+                "content": "Who wrote this book?\nAnswer the question using a single word or phrase."
+            },
+            {
+                "role": "assistant",
+                "content": "Clear Englebert"
+            },
+            {
+                "role": "user",
+                "content": "What is the title of this book?"
+            },
+            {
+                "role": "assistant",
+                "content": "Feng Shui for Love & Money"
+            },
+            {
+                "role": "user",
+                "content": "What type of book is this?"
+            }
+        ]
+    }
+]

mmu_validation/sofa_under_water.jpg ADDED Viewed

Git LFS Details

SHA256: 6de1ae07a9f23aed8df6108a4589188318fee6e7e8a7d7613a5d03b68fc7e125
Pointer size: 131 Bytes
Size of remote file: 125 kB

models/__init__.py ADDED Viewed

	@@ -0,0 +1,3 @@

+from .modeling_magvitv2 import VQGANEncoder, VQGANDecoder, LFQuantizer, MAGVITv2
+from .sampling import *
+from .modeling_mmada import MMadaModelLM, MMadaConfig

models/__pycache__/__init__.cpython-311.pyc ADDED Viewed

Binary file (430 Bytes). View file

models/__pycache__/common_modules.cpython-311.pyc ADDED Viewed

Binary file (19.7 kB). View file

models/__pycache__/configuration_llada.cpython-311.pyc ADDED Viewed

Binary file (9.23 kB). View file

models/__pycache__/misc.cpython-311.pyc ADDED Viewed

Binary file (2.27 kB). View file

models/__pycache__/modeling_llada.cpython-311.pyc ADDED Viewed

Binary file (75.1 kB). View file