读取性能提升 50 倍:微软更新 .NET 和 JDBC,为 AI 负载打造最佳性能环境
IT酷哥 8 月 1 日消息,科技媒体 NeoWin 今天(8 月 1 日)发布博文,报道称微软升级 .NET 和 JDBC 生态,原生支持向量数据类型,为 AI 负载打造最佳性能环境。
IT酷哥注:.NET 是一个免费的、开源的、跨平台的框架,用于构建新式应用和强大的云服务;而 JDBC(Java 数据库连接)是一种 Java 语言的数据库连接 API,它为 Java 程序提供了与数据库进行交互的标准方法。
在.NET 方面,Microsoft.Data.SqlClient 6.1.0 版本中新增了 Sqlvector 类,相比较之前效率低下的 JSON 数组格式,这个类能够处理向量格式的数据。
这种新的向量类型在读取操作中性能最高可提升 50 倍,写入操作提高了 3.3 倍,批量复制操作提高了 19 倍。IT酷哥注:这些性能测试是在 SQL Server 2025 Preview 版本上进行的,测试数据为最大 1998 大小的向量列和每个操作 10000 条记录。
由于不再需要 JSON 序列化,没有了长字符串表示,也大大降低了内存消耗。.NET 目前原生支持 32 位浮点向量,未来也将扩展支持其他数值数据类型。
在 JDBC 环境中,SQL Server 的 Microsoft JDBC 驱动程序 13.1.0 版本引入了新的 VECTOR 数据类型,可以直接用于插入、选择、存储过程和批量复制操作。这个版本也移除了基于字符串的向量处理,使其成为与 Java 驱动的 AI 应用集成的理想选择,包括提供语义搜索的应用。
值得注意的是,这些改进适用于多种平台,包括 SQL Server 2025 (17.x) Preview、Azure SQL Database、Azure SQL Managed Instance 以及 Microsoft Fabric Preview 中的 SQL 数据库。
这些改进是通过优化 Tabular Data Stream (TDS) 协议实现的,因此只有在 TDS 版本 7.4 或更高版本上才能看到这些改进。