旧 | 第 2 页,共 5 页

  • 在 SageMaker 上部署 Huggingface 模型 (一)

    在 Huggingface 上浏览模型的时候,会看到一个 Deploy 按钮,很多模型点开会看到 Amazon SageMaker 选项,然后会看到一段代码。今天便试了一下这个,下面是测试过程:在本机运行运行代码,把 Huggingface 的 模型部署到 SageMaker 上并运行推理。

  • 在 TLS 1.1 过期后上传 S3 的策略

    TLS 1.1 近期全面过期,但有些老的设备还在使用,如何最小代价升级客户端应用?这里实验了 2 种方法:改用 http 或者使用 Cloudfront。

  • EKS Ingress 跨账号创建 ALB

    在企业级生产环境下,通常会把网络服务,安全服务等产品放在统一一个公网账号下进行管理,各个业务模块也可能使用独立的账号,并且与外网隔离。 EKS 会被部署在隔离环境,那么如何创建对公网的 Ingress 呢?理想的做法是创建 Ingress 的时候直接把 ALB 创建到公网账号下,本文尝试实现这一过程。

  • 使用 LLM embeddings 进行数据存储和检索的新姿势

    大语言模型可以将文字转化为 embeddings, embeddings 是一个向量(浮点数) 数组。把向量数组存到数据库,然后我们通过搜索最接近的向量就可以得到搜索结果了。本文试验了这一方式。

  • ChatGLM-6B 的 Lora 微调

    本文是开源项目的使用记录,按照文档操作, finetune 的过程其实很简单。

  • 在 AWS 部署 AI 文生图为 Restful API 的最简单方式

    当你的大模型练就之后,“很容易” 将模型部署到 SageMaker,但我们一般需要通过 Restful API 集成到应用中。本文以 Stable Diffussion 为例,介绍了一种简便的集成方法,并提供了代码。

  • 使用 QuickSight 自动展示 S3 的 Excel 文件

    Amazon QuickSight 是 AWS 数据分析的前端展示平台,支持使用 Amazon S3 存储桶的 Excel 文件作为数据集。本文介绍了如何设置 S3 和 如何配置自动刷新。

  • 使用 Java 组装 Amazon Textract 解析出来的键值对

    Amazon Textract 就是 OCR, 针对国际单据啥的识别有奇效,看控制台的 Demo 觉得很受惊,居然有 KV 键值对的显示。但用 Java 代码咋获取键值对呢?他的 KEY_VALUE_SET 类型的 Block 使用方法 .text() 啥都没有哇。

  • 在 AWS 里,使用 Jenkins 跨账号执行任务

    在 AWS 中,企业的 Jenkins 通常安装在开发测试环境,如果需要操作生产环境中的资源,如何设置权限呢?本文介绍了方法。

  • 使用 Lambda 配合 GuardDuty 事件封禁攻击源

    在针对 AWS 的网络攻击过程中,有一类攻击是暴力破解 root 账号,此类攻击会被 GuardDuty 监控并记录到。当发生此类暴力破解事件的时候,可以通过 Lambda 来对攻击源进行及时封禁。

欢迎转载文章,转载不用和我说。 本站所有信息均代表我自己,不代表任何公司。