DeepEval是一款全能的LLM应用评估框架,可让用户轻松识别和迭代不令人满意的LLM输出。它目前提供了14+种评估指标,如幻觉、摘要、G-Eval、RAGAS等,供用户以Pytest样式或组件化方式评估整个数据集。
Read MoreAdobe放弃了收购产品设计软件公司Figma的计划,因为没有明确的路径获得交易的监管批准。英国和欧盟竞争监管机构都对该交易进行了调查,因为它对产品设计、图像编辑和插图市场将产生影响。根据合并协议的条款,Adobe...
Read MoreAWS最近推出了新的低延迟S3存储类别——S3 Express One Zone,与S3标准相比费用高出8倍。尽管价格昂贵,但对于新兴的创业公司来说,它是一个显著的时间节省者,可能会很吸引人。
Read MoreGoogle推出了Imagen 2,这是一种增强的AI图像模型,可供经批准的Google Cloud Vertex AI用户使用,提供文本渲染,标志以及多语言翻译等新功能。Imagen 2可以通过Google Cloud的AutoML API和Vision API实现。该模型使...
Read More近日,一款云原生的AI网关——BricksLLM,引起了广泛关注。这款使用Go语言编写的AI网关可以作为OpenAI的代理,并允许用户创建具有速率限制、成本限制和TTL的API密钥。BricksLLM是一个开源项目,可在GitHub上找到。它的...
Read MoreNuekit是一款静态网站生成器和Web应用程序构建工具。它具有内容、布局、样式和反应式岛屿的通用热重载功能。Nuekit为网站和单页应用程序提供了客户端路由。
Read More谷歌的Gemini AI模型尽管有令人印象深刻的演示视频,但仅导致谷歌股票的微小增长,反映了对其实时功能的怀疑,因为演示使用的是预先录制的镜头和编辑过的回答。这种怀疑反映了AI行业的更广泛担忧,即公司创造了高期...
Read More