BHATT, Dvijesh; THAKKAR, Priyank. Improving Narrative Coherence in Dense Video Captioning through Transformer and Large Language Models. Journal of Innovative Image Processing, [S. l.], v. 7, n. 2, p. 333–361, 2025. DOI: 10.36548/jiip.2025.2.005. Disponível em: https://irojournals.com/iroiip/article/view/783. Acesso em: 20 mar. 2026.