利用Tensorflow实现基于矩阵乘法的余弦相似度大规模计算

最新推荐文章于 2026-06-26 13:04:30 发布

原创

最新推荐文章于 2026-06-26 13:04:30 发布 · 1.7k 阅读

标签

#tensorflow #深度学习 #机器学习

收录于

本文介绍了一种使用TensorFlow解决大规模数据余弦相似度计算的方法。通过将数据拆分并利用GPU资源，实现了在10^4x10^4规模下约20秒的计算时间，显著提高了计算效率。代码示例展示了如何处理新老用户特征数据，最终生成新老用户之间的相似度矩阵。

在推荐系统中，经常会计算用户—用户相似度、用户—产品相似度，而两类业务中都会涉及到很大量级的数据，导致最终的相似度矩阵计算规模更大。

本文旨在解决高效计算大规模数据的余弦相似度计算问题。

#导入 tensorflow 模块，因部分用到1.x版本的Tensorflow，因此用如下方式导入
import tensorflow.compat.v1 as tf
tf.disable_v2_behavior()

import numpy as np
import pandas as pd
import math
from datetime import datetime

# 定义余弦相似度函数，便于后续检验结果
def cos_sim(a, b):
    a_norm = np.linalg.norm(a)
    b_norm = np.linalg.norm(b)
    s = a_norm * b_norm
    if s==0:
        cos = 0
    else:
        cos = np.dot(a,b)/s
    return cos

#设定余弦相似度矩阵按多少行进行拆分，40GB内存，6GB显存的机器大概能计算31000*31000的余弦相似矩阵，
#因此大多数分析场景均需要对数据源矩阵进行拆分，实际数值根据机器所承受的最大数值进行设定
BRANCH_C = 10000

#导入处理好的新老用户特征数据
csv_New = pd.read_csv('./df_1_unknown_group.txt', header=None)      #新用户的特征数据集
csv_O

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Eureka丶

关注关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
打赏
打赏
打赏举报

举报

专栏目录

【企业管理】企业全岗位综合运营与组织知识矩阵体系04 产品线（1）

weixin_49199313的博客

08-07

1133

销售渠道中的灰色分利行为是侵蚀企业利润、破坏市场秩序的核心风险，需结合制度漏洞、人性博弈与监管失效三维度分析。

参与评论您还未登录，请先登录后发表或查看评论

tensorflow实现余弦cosine相似度

wzg2016的博客

03-29

4721

最近对tensorflow日渐失望，不通版本不通模块之间的不兼容问题实在操蛋，导致自己都不知道算法运行的效果差是idea不行的原因还是tensorflow未知bug的原因。所以，现在倾向于，比较简单的模块，或者轮子，能尽量自己实现就自己实现吧。除了避免未知的bug之外，还能为自己的需求量身定制。自己还能知根知底，避免盲目崇拜。自己正处在远离tensorflow的边缘。直接上代码吧： def tf_cosine_distance(self, tensor1,tensor2): """ co

tensorflow 如何计算向量余弦相似 cosine similarity

weixin_43092343的博客

01-20

2534

如何计算余弦相似度 cosine similarity

余弦计算相似度度量

热门推荐

京东云成都团队的专栏

11-11

5万+

余弦计算相似度度量相似度度量（Similarity），即计算个体间的相似程度，相似度度量的值越小，说明个体间相似度越小，相似度的值越大说明个体差异越大。对于多个不同的文本或者短文本对话消息要来计算他们之间的相似度如何，一个好的做法就是将这些文本中词语，映射到向量空间，形成文本中文字和向量数据的映射关系，通过计算几个或者多个不同的向量的差异的大小，来计算文本的相似度。下面介绍一个详细成熟的向

使用TensorFlow实现余弦距离/欧氏距离（Euclidean distance）以及Attention矩阵的计算

呜呜哈的博客

04-11

3万+

最近在使用tensorflow完成句子相似度建模等任务时常常会用到各种距离的计算，而且有很多论文提出了Attention机制，所以这里就介绍一下如何使用tensorflow实现上述各种功能。这里首先假定我们的输入是两个四维的Tensor，然后我们需要计算的是其中某个维度的距离。比如说我们的输入是batch个句子，句长是sent_len, 每个词被表示成embed_size的词向量。所以我们的输入

余弦相似度计算的实现方式

HUSTHY的博客

11-21

1万+

自己手写实现一个，numpy、sklearn、scipy.spatial等当数据量大了以后就得采用其他的方法了，faiss库和GGNN-graph-based GPU nearest neighbor search 先做调研

别再只用欧氏距离了！用Python的Scikit-learn和PyTorch搞定文本/图像嵌入的余弦相似度计算

weixin_42683392的博客

04-03

179

本文深入探讨了在高维嵌入空间中如何从欧氏距离迁移到余弦相似度（Cosine Similarity）的全面指南。通过Python生态中的NumPy、Scikit-learn、PyTorch和TensorFlow四大工具链，详细展示了工业级实现方案，帮助开发者在处理BERT词向量、CLIP图像特征等高维数据时，选择更优的相似度计算方法。

gitblog_01061的博客

04-01

1036

LLM大模型学习圣经：从0到1吃透Transformer技术底座

ailiandeziwei的专栏

04-26

2268

大语言模型（英文：Large Language Model，缩写LLM），即大型语言模型 (LLM)，大型语言模型 (LLM) 之所以大，是指具有大规模参数和复杂计算结构（超过 10 亿个参数），LLM通常基于 Transformer 模型架构，由深度神经网络构建，对海量数据进行预训练处理。LLM的特点是规模庞大，包含数十亿的参数，帮助它们学习语言数据中的复杂模式。大模型的底层转换器包含一系列神经网络，分为编码器和解码器，且具有自注意力功能。

手写Doc2Vec实现新闻语义聚类：从向量构建到可解释分类

最新发布

weixin_30753873的博客

06-26

326

文档向量化是无监督文本分析的基础技术，其核心原理是通过上下文共现建模将离散文本映射为稠密语义向量；技术价值在于摆脱对大模型和黑盒API的依赖，兼顾轻量部署、全程可控与领域适配能力；典型应用场景包括金融舆情监控、政策文件归类、企业公告分拣等短文本密集型任务；本文聚焦Doc2Vec手写实现与K-Means++聚类联动，深度融合TF-IDF加权词表、分段滑动窗口、Adagrad梯度优化与向量Z-score标准化等关键实践，确保向量空间既保有语义方向性，又承载语义强度信号。

NLP实战情报简报：从模型部署到数据集陷阱的工程指南

weixin_34187862的博客

06-25

297

自然语言处理（NLP）作为人工智能的核心分支，其技术落地远不止于模型训练——更关键的是在真实场景中完成可复现、可部署、可教学的闭环实践。理解NLP工具链（如Stanza、T5、TensorFlow Lite）的原理与限制，掌握ALFRED等结构化数据集的隐藏语义与物理约束，是提升工程鲁棒性与教学有效性的基础能力。这类实践知识往往散落在GitHub笔记、Colab教程和社区简报中，而非传统论文或文档里。本文聚焦NLP一线工程师高频接触的三大实操维度：轻量模型在边缘设备的加速部署、多语种文本预处理的细节陷阱、以

Python深度学习：从入门到实战

weixin_45747731的博客

03-30

307

亲爱的读者，欢迎您翻开这本书。我们即将探索的，是深度学习的宇宙——一个由数据、算法与算力构筑的奇妙世界。它既是严谨的科学，也是创造的艺术，更是一条通往未来智慧的修行之路。本书将带您从最基础的数学原理出发，亲手搭建神经网络，驾驭Transformer等前沿模型，最终将智慧转化为现实世界的价值。请放下畏惧，保持好奇。这不仅是一次知识的学习，更是一场思维的远行。来，随我一起，开启这趟非凡的旅程吧。

【信息科学与工程学】【安全领域】第三十五篇网络安全算法表

weixin_49199313的博客

03-01

1161

编号算法名称算法的逐步骤思考推理的数学方程式和分解的数学方程式参数/变量列表复杂度（时间/空间）1AES (高级加密标准)1. 密钥扩展：从初始密钥生成轮密钥。 2. 初始轮： 3. 主轮循环（Nr-1轮）： - SubBytes：（非线性字节替换） - ShiftRows：对状态矩阵的行进行循环移位。 - MixColumns：（在GF(2⁸)上的矩阵乘法） - AddRoundKey： 4. 最终轮：执行SubBytes、ShiftRows、AddR

《从函数到大模型速通》

m0_59777389的博客

04-28

404

我们把之前一个个加减乘除很麻烦的写法，写成了矩阵的形式。一是为了方便讨论，比如刚刚介绍CNN的时候，就从公式直接看出，就是差乘变成了卷积运算而已。二是可以更好的利用GPU的并行计算，提高效率。接下来我们把之前默认的那种所有神经元都连起来的形式叫做全连接，进而通过图像识别这个任务意识到了全连接的局限性。接下来我们通过卷积运算代替了全连接层的标准矩阵乘法，一方面使得训练参数大大的减少，另外一方面也更有利于提取图像的局部特征，这就解决了我们一开始说的问题。

51c深度学习~合集8

whaosoft~aiotの开发板商城

11-22

2804

方法的完整数学描述略显复杂，如果只是想了解主要思想，可以只看上面 PatchMix的流程图即可（其实只是公式多，每个公式也不复杂，后续有机会做个演示动画，帮助大家理解。这个方法也可以用简单的 Mask 方法实现，但是本方法在大规模图像处理上效率是最高的），对该工作感兴趣的同行可以看一下，我尽量写得清楚一些。结合 PatMix 的流程图，主要过程如下：由于混合图像和混合图像之间，重叠比例的不同，mix-to-mix label 中每一项的权重分数是不同的，根据上图，可以得到权重系数可以表示为。

【信息科学与工程学】【安全领域】第十二篇简述数据安全体系与保密技术

weixin_49199313的博客

12-17

1575

设计一个自适应窗口调整算法，本质上是为您的系统装备一个能够感知环境、智能决策的“自动驾驶”模式。核心在于明确您的核心目标（是优先延迟还是精度），然后据此精心设计触发条件和调整策略。

视觉-语言模型如何重构目标跟踪范式

weixin_34379433的博客

06-24

387

目标跟踪已从传统检测+关联的像素级定位，演进为融合语义理解与跨模态协同的新型任务。其核心原理在于打破文本指令与视觉特征之间的语义鸿沟，通过视觉-语言模型实现端到端的‘指令驱动跟踪’。这一技术升级显著提升了复杂场景下的ID稳定性与业务适配性，尤其在安防、物流、工业巡检等需响应自然语言查询的领域展现出不可替代的价值。本文聚焦Object Tracking与Vision-Language Models的工程落地断层，解析从经典方法到多模态协同的关键跃迁路径。

【信息科学与工程学】【运营科学】第二篇 C4信息与通信网络运营 (C4) ——数据中心网络运营06

weixin_49199313的博客

03-26

923

13 | 司法诉讼 | 原告律师 | 争取和解优势 | 证据披露的序贯博弈 | 策略性证据释放 | 持有证据集E = {强证据e_s，中证据e_m，弱证据e_w}。设公众原有认知人格向量为 Pold=(p1，p2，...，pk)，其中p_i为负面特质（如“不敬业”）。危机后，通过行为序列 {At}和宣传，将公众认知向新向量 Pnew引导，使得在关键维度上， Pnew与 Pold的余弦相似度降低，并与一个正面的、可接受的“原型”（如“浪子回头”、“慈父”）对齐。

MLOps本质：机器学习工业化落地的操作系统

weixin_30568591的博客

06-06

345

MLOps 是面向机器学习全生命周期的工程化方法论，其核心在于解决数据、模型与业务逻辑协同演进的不确定性问题。不同于传统 DevOps 关注代码构建与部署，MLOps 强调数据契约、特征工厂与模型治理三大支柱，通过版本化数据快照、可复用特征服务和带血缘关系的模型制品包，实现从实验到生产的可信交付。技术价值体现在提升模型迭代稳定性、加速业务反馈闭环、支撑实时推荐、语音识别、工业视觉等关键场景的持续可用性。本文深入剖析 MLOps 的设计逻辑、流水线实践与六大典型落地场景，聚焦 Data Science 工程化

大数据推荐算法之基于物品协同过滤推荐实例

xxylql的博客

07-14

9236

ItemCF:ItemCollaborationFilter,基于物品的协同过滤算法核心思想:给用户推荐那些和他们之前喜欢的物品相似的物品。 Iterm-based的基本思想是预先根据所有用户的历史偏好数据计算物品之间的相似性，然后把与用户喜欢的物品相类似的物品推荐给用户。还是以之前的例子为例，可以知道物品a和c非常相似，因为喜欢a的用户同时也喜欢c，而用户A喜欢a，所以把c推荐给用