论文地址:https://arxiv.org/pdf/2401.00908.pdf
🖼️ 多模态人工智能的兴起,使历史模拟更加生动,通过图像与文本交互生成历史场景。
Text2Immersion是一项创新方法,通过文本提示生成高质量的3D沉浸式场景,可适用于室内和室外,展现出色的灵活性和创造力。
站长之家(ChinaZ.com)1月4日 消息:斯坦福大学的研究人员利用维基百科数据训练了一个大模型,命名为WikiChat,通过优化和改进,成功解决了大模型的幻觉问题,并在事实准确性和其他指标上表现优秀。他们的最佳模型在新的基准测试中获得了97.3%的事实准确性,远远超过了GPT-4的66.1%。此外,WikiChat还在相关性、信息性、自然性、非重复性和时间正确性方面领先其他模型。
BakLLaVA是使用LLaVA1.5架构增强的Mistral7B基础模型,具备更好的性能和商用能力。BakLLaVA在多个基准测试中优于LLaVA213B,并且可以在某些数据上进行微调和推理。虽然BakLLaVA在训练过程中使用了LLaVA的语料库,不允许商用,但BakLLaVA2则采用了更大的数据集和更新的架构,超越了当前的LLaVA方法,具备商用能力。