About Me
Blogs
Projects
100-PwC
Learning Notes
Stanford CS336 LLM From Scratch
Stanford CME296 Diffusion & Large Vision Models
Lecture 12: Evaluation Metrics
Lecture 12: Evaluation Metrics
Lecture 12介绍了评估语言模型性能的各种指标和方法。内容涵盖了传统的评估指标,如困惑度(Perplexity)、准确率(Accuracy)等,以及更适用于生成任务的指标,如BLEU、ROUGE和METEOR等。此外,还讨论了人类评估的重要性及其在模型评估中的作用。通过这些评估方法,可以更全面地了解语言模型的表现和改进方向。
Author
Yuyang Zhang
Back to top