Personalized Daily ArXiv Papers 2025-08-12

[gpt-4o]	Prompt	Completion	Total
Token	40004	4926	44930
Cost	$0.1	$0.05	$0.15

Total arXiv papers: 874

Total scanned papers: 579

Total relevant papers: 25

Table of contents with paper titles:

A Spin Glass Characterization of Neural Networks Authors: Jun Li
BoRA: Towards More Expressive Low-Rank Adaptation with Block Diversity Authors: Shiwei Li, Xiandi Luo, Haozhao Wang, Xing Tang, Ziqiang Cui, Dugang Liu, Yuhua Li, Xiuqiang He, Ruixuan Li
From Product Hilbert Spaces to the Generalized Koopman Operator and the Nonlinear Fundamental Lemma Authors: Mircea Lazar
Less Is More: Training-Free Sparse Attention with Global Locality for Efficient Reasoning Authors: Lijie Yang, Zhihao Zhang, Arti Jain, Shijie Cao, Baihong Yuan, Yiwei Chen, Zhihao Jia, Ravi Netravali
Generalizing Scaling Laws for Dense and Sparse Large Language Models Authors: Md Arafat Hossain, Xingfu Wu, Valerie Taylor, Ali Jannesari
DySK-Attn: A Framework for Efficient, Real-Time Knowledge Updating in Large Language Models via Dynamic Sparse Knowledge Attention Authors: Kabir Khan, Priya Sharma, Arjun Mehta, Neha Gupta, Ravi Narayanan
What One Cannot, Two Can: Two-Layer Transformers Provably Represent Induction Heads on Any-Order Markov Chains Authors: Chanakya Ekbote, Marco Bondaschi, Nived Rajaraman, Jason D. Lee, Michael Gastpar, Ashok Vardhan Makkuva, Paul Pu Liang
Can LLMs Detect Their Confabulations? Estimating Reliability in Uncertainty-Aware Language Models Authors: Tianyi Zhou, Johanne Medina, Sanjay Chawla
Intrinsic training dynamics of deep neural networks Authors: Sibylle Marcotte, Gabriel Peyr\'e, R\'emi Gribonval
Multi-head Transformers Provably Learn Symbolic Multi-step Reasoning via Gradient Descent Authors: Tong Yang, Yu Huang, Yingbin Liang, Yuejie Chi
Deep Ignorance: Filtering Pretraining Data Builds Tamper-Resistant Safeguards into Open-Weight LLMs Authors: Kyle O'Brien, Stephen Casper, Quentin Anthony, Tomek Korbak, Robert Kirk, Xander Davies, Ishan Mishra, Geoffrey Irving, Yarin Gal, Stella Biderman
Representation Understanding via Activation Maximization Authors: Hongbo Zhu, Angelo Cangelosi
PiKV: KV Cache Management System for Mixture of Experts Authors: Dong Liu, Yanxuan Yu, Ben Lengerich, Ying Nian Wu, Xuhong Wang
Towards High-Order Mean Flow Generative Models: Feasibility, Expressivity, and Provably Efficient Criteria Authors: Yang Cao, Yubin Chen, Zhao Song, Jiahao Zhang
Attribution Explanations for Deep Neural Networks: A Theoretical Perspective Authors: Huiqi Deng, Hongbin Pei, Quanshi Zhang, Mengnan Du
Stochastic dynamics learning with state-space systems Authors: Juan-Pablo Ortega, Florian Rossmannek
Training-Free ANN-to-SNN Conversion for High-Performance Spiking Transformer Authors: Jingya Wang, Xin Deng, Wenjie Wei, Dehao Zhang, Shuai Wang, Qian Sun, Jieyuan Zhang, Hanwen Liu, Ning Xie, Malu Zhang
Parity Requires Unified Input Dependence and Negative Eigenvalues in SSMs Authors: Behnoush Khavari, Mehran Shakerinava, Jayesh Khullar, Jerry Huang, Fran\c{c}ois Rivest, Siamak Ravanbakhsh, Sarath Chandar
Graph is a Natural Regularization: Revisiting Vector Quantization for Graph Representation Learning Authors: Zian Zhai, Fan Li, Xingyu Tan, Xiaoyang Wang, Wenjie Zhang
DETACH: Cross-domain Learning for Long-Horizon Tasks via Mixture of Disentangled Experts Authors: Yutong Shen, Hangxu Liu, Penghui Liu, Ruizhe Xia, Tianyi Yao, Yitong Sun, Tongtong Feng
Fractal Language Modelling by Universal Sequence Maps (USM) Authors: Jonas S Almeida, Daniel E Russ, Susana Vinga, Ines Duarte, Lee Mason, Praphulla Bhawsar, Aaron Ge, Arlindo Oliveira, Jeya Balaji Balasubramanian
Semantic Caching for Low-Cost LLM Serving: From Offline Learning to Online Adaptation Authors: Xutong Liu, Baran Atalar, Xiangxiang Dai, Jinhang Zuo, Siwei Wang, John C. S. Lui, Wei Chen, Carlee Joe-Wong
Mode-Aware Non-Linear Tucker Autoencoder for Tensor-based Unsupervised Learning Authors: Junjing Zheng, Chengliang Song, Weidong Jiang, Xinyu Zhang
Barron Space Representations for Elliptic PDEs with Homogeneous Boundary Conditions Authors: Ziang Chen, Liqiang Huang
Efficient Edge LLMs Deployment via HessianAware Quantization and CPU GPU Collaborative Authors: Tuo Zhang, Ning Li, Xin Yuan, Wenchao Xu, Quan Chen, Song Guo, Haijun Zhang

1. A Spin Glass Characterization of Neural Networks

ArXiv ID: 2508.07397

Authors: Jun Li

Abstract: This work presents a statistical mechanics characterization of neural networks, motivated by the replica symmetry breaking (RSB) phenomenon in spin glasses. A Hopfield-type spin glass model is constructed from a given feedforward neural network (FNN). Overlaps between simulated replica samples serve as a characteristic descriptor of the FNN. The connection between the spin-glass description and commonly studied properties of the FNN -- such as data fitting, capacity, generalization, and robustness -- has been investigated and empirically demonstrated. Unlike prior analytical studies that focus on model ensembles, this method provides a computable descriptor for individual network instances, which reveals nontrivial structural properties that are not captured by conventional metrics such as loss or accuracy. Preliminary results suggests its potential for practical applications such as model inspection, safety verification, and detection of hidden vulnerabilities.

Comment: The paper provides a novel statistical mechanics characterization of neural networks, offering insights into their structure and properties beyond conventional metrics.