[1]

D. Bhatt and P. Thakkar, “Improving Narrative Coherence in Dense Video Captioning through Transformer and Large Language Models”, JIIP, vol. 7, no. 2, pp. 333–361, Jun. 2025, doi: 10.36548/jiip.2025.2.005.