资源摘要:题目类型分区摘要精读链接Comparing large language models and humanprogrammers for generating programming code代码评估arxiv评估七种LLMs在生成编程代码方面的性能,探讨不同提示策略对LLMs编码性能的影响,直接比较LLMs与人类程序员的编程能力,评估LLMs在不同编程语言之间生成和翻译代码的能力,以及考察LLMs的计算效率和从过去错误中学习的能力。A Comparison of the Effectiveness of ChatGPT andCo-Pilot for Generating Quality Python Code代码评估会议包括评估ChatGPT和Copilot在解决LeetCode编程问题上的有效性,探讨ChatGPT在接收到反馈后纠正代码的能力,以及其在提高代码质量和性能方面的潜力。Program Code Generation with Generative AIs代码评估MDPI水刊-Algorithms非SCI比较了人类生成的代码