将两台 DGX Spark 从不稳定的 vLLM TP=2 跨节点部署迁移到单节点独立运行 + Bifrost 负载均衡网关的完整实践和 benchmark 结果。
Java 项目怎么做 contract testing:一次 Spring Cloud Contract 实践
基于 java-contract 仓库的工程复盘:REST API 和 Kafka 消息 contract 如何在 Java 25 + Spring Boot 3.5 + Maven 多模块项目里分别落地,producer 验证、consumer stubs 和 CI Quality Gates 如何串起来。
没有 Service Mesh,用 API Gateway 做用户级灰度
没有 Istio/Linkerd 的环境下,Shop Platform 用 Spring Cloud Gateway MVC 的自定义 Predicate + Redis Set + Caffeine 本地缓存,实现按 buyerId 的用户级灰度路由;并讨论配合 OpenFeature 做下游代码路径灰度的演进路径。
Nemotron EP2 vs TP2:两台 DGX Spark 的实际对比
在两台 DGX Spark 上对比 vLLM EP2 和 TP2 跑 NVIDIA Nemotron 3 Super 120B A12B NVFP4 的结果,并分析 EP2 失稳的可能原因。
Compose Multiplatform 跨端实战:一套代码跑 WASM / Android / iOS 的电商应用
Shop Platform 的前端策略采用 Compose Multiplatform 实现买家和卖家两套共享模块,并面向 WASM Web、Android 与 iOS framework targets 编译。本文详解 core/feature*/ui-shared 的分层设计、WASM 前端策略、与后端 BFF 的 JWT 协作,以及当前阶段已经落地与尚未补齐的边界。
Spring Boot 3.5 微服务 tracing 为什么会断链:一次 HTTP 客户端治理复盘
Tracing 断链很少是 @HttpExchange 能解决的问题。一次 Spring Boot 3.5 + Micrometer + OpenTelemetry 的复盘:用 W3C Trace Context、baggage 白名单和 auto-configured RestClient.Builder 把 trace 和业务上下文一起稳定地跨服务传下去。
tmux 远程服务器实践:尽量降低 SSH 中断对命令的影响
记录我在远程服务器(DGX Spark / GPU 集群)上部署 vLLM 或运行长时间任务时,如何用 tmux 降低 SSH 断连带来的影响。包含 Makefile 集成方案和一些外部参考。
Spring Boot 3.5 下数据库实践记录:HikariCP 调优、N+1 防护、事务管理与 Testcontainers 集成
数据库往往是微服务里比较关键的依赖之一。本文结合当前仓库经验,整理 HikariCP 连接池调优、open-in-view: false 的影响、@EntityGraph 防 N+1、@Transactional 传播行为、Testcontainers @ServiceConnection 集成和 Flyway 进阶实践。
vLLM TP=2 跨节点部署实践:两台 DGX Spark 跑 Qwen3.5-35B-A3B
记录首次在两台 DGX Spark 上以 vLLM TP=2 方式部署 Qwen3.5-35B-A3B 的过程与 benchmark 结果。
Spring Boot 3.5 下 Redis 实战记录:从连接池调优到 Bloom Filter 自动配置
Redis 在 Shop Platform 中承担缓存、限流、分布式锁、Bloom Filter、Lua 原子操作等多重角色。本文结合当前仓库里的实现,整理 Lettuce 连接池、序列化策略、Redisson 分布式锁、Bloom Filter 自动配置和 Lua 脚本加载方式的实践记录。