Publications

The following publications report results funded in part by France 2030 program, managed by the ANR, project HOLIGRAIL (ANR-23-PEIA-0010), in the context of the PEPR IA.

Publications HAL du projet ANR. holigrail

2026

Conference papers

titre
Bug dans plusieurs solveurs de programmation linéaire en nombres entiers
auteur
Rémi Garcia, Anna Lambert
article
ROADEF 2026 – 27ème édition du congrès annuel de la Société Française de Recherche Opérationnelle et d’Aide à la Décision, Feb 2026, Tours, France
Accès au texte intégral et bibtex
https://hal.science/hal-05450053/file/ROADEF2026.pdf BibTex

2025

Journal articles

titre
Error Analysis of Sum-Product Algorithms under Stochastic Rounding
auteur
Pablo de Oliveira Castro, El-Mehdi El Arar, Eric Petit, Devan Sohier
article
SIAM Journal on Scientific Computing, 2025, 47 (6), pp.B1481–B1502. ⟨10.1137/24M1710966⟩
Accès au texte intégral et bibtex
https://hal.science/hal-04787542/file/main.pdf BibTex

Conference papers

titre
Towards optimal reconfigurable constant multipliers
auteur
Bastien Barbe, Xiao Peng, Anastasia Volkova, Florent de Dinechin
article
28th Conference on Digital System Design (DSD), Euromicro, Sep 2025, Salerno, Italy. pp.418-425, ⟨10.1109/DSD67783.2025.00064⟩
Accès au texte intégral et bibtex
https://hal.science/hal-05094796/file/2025-DSD-RSCM.pdf BibTex
titre
RETROSPECTIVE: Table-based polynomials for fast hardware function evaluation
auteur
Florent de Dinechin
article
ASAP 2025 – 36th IEEE International Conference on Application-specific Systems, Architectures and Processors, Jul 2025, Vancouver (British Columbia), Canada
Accès au texte intégral et bibtex
https://inria.hal.science/hal-05139896/file/2025-ASAP-RetroHOTBM.pdf BibTex
titre
Hardware Fixed-Point 2D and 3D norms
auteur
Romain Bouarah, Florent de Dinechin
article
32nd IEEE International Symposium on Computer Arithmetic – ARITH 2025, May 2025, El Paso, Texas, United States
Accès au texte intégral et bibtex
https://inria.hal.science/hal-04986776/file/2025-Arith-Norms.pdf BibTex
titre
Hardware-Aware Training for Multiplierless Convolutional Neural Networks
auteur
Rémi Garcia, Léo Pradels, Silviu-Ioan Filip, Olivier Sentieys
article
ARITH 2025 – 32nd IEEE International Symposium on Computer Arithmetic, May 2025, El Paso, United States. pp.1-8
Accès au texte intégral et bibtex
https://hal.science/hal-04949886/file/GPFS_CNN_ARITH2025.pdf BibTex
titre
Double-Word Decomposition in a Combined FP16, BF16 and FP32 Dot Product Add Operator
auteur
Orégane Desrentes, Benoît Dupont de Dinechin, Florent de Dinechin
article
ARITH 2025 – IEEE 32nd International Symposium on Computer Arithmetic, May 2025, El-Paso, Texas, United States
Accès au texte intégral et bibtex
https://inria.hal.science/hal-04982397/file/Desrentes2025_Double-Word_Decomposition_in_a_Combined_FP16_BF16_and_FP32_Dot_Product_Add_Operator.pdf BibTex
titre
MPTorch-FPGA: a Custom Mixed-Precision Framework for FPGA-based DNN Training
auteur
Sami Ben Ali, Silviu-Ioan Filip, Olivier Sentieys, Guy Lemieux
article
DATE 2025 – 28th IEEE/ACM Design, Automation and Test in Europe, Mar 2025, Lyon, France. pp.1-6
Accès au texte intégral et bibtex
https://hal.science/hal-04882989/file/article_sami_DATE2025.pdf BibTex

Poster communications

titre
Network Folding: A Resource-Efficient Approach for DNN Streaming Architectures
auteur
Van-Quan Pham, Adrien Prost-Boucle, Olivier Muller, Fréderic Pétrot
article
CNRS. GDR-SoC2 2025, Jun 2025, Lorient (56100), France. CNRS
Accès au texte intégral et bibtex
https://hal.science/hal-05283516/file/PHAM_GDR_SoC_2025-12.pdf BibTex
titre
Towards Multi-Level Arithmetic Optimizations
auteur
Pierre Cochard, Luc Forget, Florent de Dinechin, Louis Ledoux
article
EuroLLVM 2025 –, Apr 2025, Berlin, Germany
Accès au texte intégral et bibtex
https://hal.science/hal-05063466/file/2025-eurollvm.pdf BibTex

Preprints, Working Papers, …

titre
KANHard: Training Hardware-Friendly Kolmogorov-Arnold Networks
auteur
Romain Bouarah, Bastien Barbe, Anastasia Volkova, Florent de Dinechin
article
2025
Accès au texte intégral et bibtex
https://hal.science/hal-05388006/file/kanhard2025.pdf BibTex
titre
Contribution to Error Analysis of Deep Neural Networks: Case of the Activation Functions
auteur
Maria L. Reyna Cruz, Kristalys Ruiz-Rohena, Yahriel I. Guel, Henry Salgado, Lisa Taldir, Elian Pena Ramos, Natalia Cervantes, Tzetzaith Rivero, Martine Ceberio, Christoph Lauter, Anastasia Volkova
article
2025
Accès au texte intégral et bibtex
https://inria.hal.science/hal-05367563/file/Error_Analysis_Activation_Functions-HAL-2.pdf BibTex
titre
BEYOND WEIGHT-ONLY: MIXED-PRECISION QUAN-TIZATION FOR BERT WEIGHTS, ACTIVATIONS AND EMBEDDINGS
auteur
Cédric Gernigon, Xavier Pillet, Anastasia Volkova, Richard Dufour
article
2025
Accès au texte intégral et bibtex
https://inria.hal.science/hal-05322672/file/BERT_Quant_Mixed_Precision-2.pdf BibTex
titre
Probabilistic error analysis of limited-precision stochastic rounding
auteur
El-Mehdi El Arar, Massimiliano Fasi, Silviu-Ioan Filip, Mantas Mikaitis
article
2025
Accès au texte intégral et bibtex
https://hal.science/hal-04665809/file/main.pdf BibTex
titre
Mixed precision accumulation for neural network inference guided by componentwise forward error analysis
auteur
El-Mehdi El Arar, Silviu-Ioan Filip, Theo Mary, Elisa Riccietti
article
2025
Accès au texte intégral et bibtex
https://hal.science/hal-04995708/file/main.pdf BibTex

2024

Journal articles

titre
Combining Weight Approximation, Sharing and Retraining for Neural Network Model Compression
auteur
Prachi Kashikar, Olivier Sentieys, Sharad Sinha
article
ACM Transactions on Embedded Computing Systems (TECS), 2024, 23, pp.1 – 23. ⟨10.1145/3687466⟩
Accès au texte intégral et bibtex
https://hal.science/hal-04764621/file/Prachi_TECS24.pdf BibTex

Conference papers

titre
Autonomous FPGA Reconfigurability in Embedded Systems
auteur
Hugo Boulissière, Adrien Prost-Boucle, Elena Ioana Vatajelu, Giorgio Di Natale
article
20th IEEE East-West Design & Test Symposium (EWDTS 2024), IEEE, Nov 2024, Yerevan, Armenia. ⟨10.1109/EWDTS63723.2024.10873607⟩
Accès au texte intégral et bibtex
https://hal.science/hal-04917041/file/EWDTS%20-%20Autonomous%20FPGA%20Reconfigurability%20in%20Embedded%20Systems.pdf BibTex
titre
Robustness of tensor decomposition-based neural network compression
auteur
Théo Rudkiewicz, Mohamed-Oumar Ouerfelli, Riccardo Finotello, Zakariya Chaouai, Mohamed Tamaazousti
article
ICIP 2024 – IEEE International Conference on Image Processing, Oct 2024, Abu Dhabi, United Arab Emirates. pp.221-227, ⟨10.1109/ICIP51287.2024.10647942⟩
Accès au texte intégral et bibtex
https://cea.hal.science/cea-05029995/file/ICIP_Robustesse_NoteIEEE.pdf BibTex
titre
Tightening I/O Lower Bounds through the Hourglass Dependency Pattern
auteur
Lionel Eyraud-Dubois, Guillaume Iooss, Julien Langou, Fabrice Rastello
article
SPAA 2024 – 36th ACM Symposium on Parallelism in Algorithms and Architectures, Jun 2024, Nantes, France. pp.1-34
Accès au texte intégral et bibtex
https://inria.hal.science/hal-04555744/file/main_HAL.pdf BibTex
titre
A Stochastic Rounding-Enabled Low-Precision Floating-Point MAC for DNN Training
auteur
Sami Ben Ali, Silviu-Ioan Filip, Olivier Sentieys
article
DATE 2024 – 27th IEEE/ACM Design, Automation and Test in Europe, Mar 2024, Valencia, Spain. pp.1-6
Accès au texte intégral et bibtex
https://hal.science/hal-04380270/file/main.pdf BibTex
titre
AdaQAT: Adaptive Bit-Width Quantization-Aware Training
auteur
Cédric Gernigon, Silviu-Ioan Filip, Olivier Sentieys, Clément Coggiola, Mickael Bruno
article
IEEE 6th International Conference on AI Circuits and Systems (AICAS), 2024, Abu Dhabi, United Arab Emirates
Accès au texte intégral et bibtex
https://hal.science/hal-04549245/file/AdaQAT%3A_Adaptive_Bit-Width_Quantization-Aware_Training.pdf BibTex

Book sections

titre
Inside the AI Accelerators: From High Performance to Energy Efficiency
auteur
Ana Pinzari, Adrien Prost-Boucle, Christelle Rabache, Frédéric Pétrot
article
Ovidiu VERMESAN – Dave MARPLES. Advancing Edge Artificial Intelligence, River Publishers, pp.87-103, 2024, 9781003478713. ⟨10.1201/9781003478713-4⟩
Accès au texte intégral et bibtex
https://hal.science/hal-04465853/file/Inside%20the%20AI%20Accelerators%3A%20From%20High%20Performance%20to%20Energy%20Efficiency.pdf BibTex

Books

titre
Application-Specific Arithmetic
auteur
Florent de Dinechin, Martin Kumm
article
Springer International Publishing, 2024, 978-3-031-42808-1. ⟨10.1007/978-3-031-42808-1⟩
Accès au bibtex
BibTex

Reports

titre
Performance debugging through microarchitectural sensitivity and causality analysis
auteur
Alban Dutilleul, Hugo Pompougnac, Nicolas Derumigny, Gabriel Rodríguez, Valentin Trophime, Christophe Guillon, Fabrice Rastello
article
INRIA. 2024, pp.1-13
Accès au texte intégral et bibtex
https://inria.hal.science/hal-04851704/file/2412.13207v1.pdf BibTex

Preprints, Working Papers, …

titre
Activations in Low Precision with High Accuracy
auteur
Tom Hubrecht, Orégane Desrentes, Florent de Dinechin
article
2024
Accès au texte intégral et bibtex
https://inria.hal.science/hal-04776745/file/2025-ALPHA.pdf BibTex
titre
SARCASM: Set-Associative Rotating Cache Analytical/Simulating Model
auteur
Guillaume Iooss, Christophe Guillon, Fabrice Rastello, Albert Cohen, Saday Sadayappan
article
2024
Accès au texte intégral et bibtex
https://inria.hal.science/hal-04814088/file/main.pdf BibTex