Search engine for discovering works of Art, research articles, and books related to Art and Culture
ShareThis
Javascript must be enabled to continue!

AI-driven zero-touch orchestration of edge-cloud services

View through CrossRef
(English) 6G networks demand orchestration systems capable of managing thousands of distributed microservices under sub-millisecond latency constraints. Traditional centralized approaches introduce unacceptable delays, create single points of failure in heterogeneous edge-cloud infrastructures, and require constant attention from human operators. This dissertation addresses three critical challenges: (1) computational constraints that prevent the deployment of predictive models on edge devices, (2) lack of generalization of models across diverse types of applications, and (3) lack of validated autonomous orchestration without human intervention. To address these challenges, this dissertation develops three complementary frameworks that combine lightweight machine learning, attention-based deep learning, and agentic artificial intelligence for zero-touch service management in distributed 6G edge-cloud environments. The first contribution, AERO (Adaptive Edge-cloud Resource Orchestration), addresses the challenge of running predictions on resource-constrained edge devices. Current transformer models require millions of parameters (e.g., Pathformer: 2.4M), making them impractical for edge deployment. AERO achieves competitive accuracy with only 599 parameters, making edge deployment feasible and reducing reliance on cloud round-trips when local inference is preferred. Evaluations demonstrate sub-millisecond inference (0.38ms), 13% energy savings, and 99% fewer SLA violations compared to reactive scheduling, which allocates resources only after demand changes occur. The second contribution, OmniFORE (Framework for Optimization of Resource Forecasts in Edge-cloud networks), addresses the operational challenge of maintaining separate models per application. A single OmniFORE model generalizes across heterogeneous workloads without retraining, replacing the need for dedicated per-application models. Cross-dataset evaluation on industry-standard benchmarks (Google and Alibaba production traces) demonstrates 30% better accuracy than ModernTCN while maintaining 15× faster inference than AGCRN. The third contribution, AgentEdge, addresses the challenge of agentic orchestration in distributed edge-cloud environments. Existing agent frameworks target generic domains or centralized cloud infrastructures, leaving distributed 6G environments without autonomous management solutions. AgentEdge introduces multi-agent orchestration to this domain, translating natural language intent (e.g., "deploy with low latency") into validated orchestration actions across heterogeneous infrastructure. Evaluations demonstrate 78.3% success rate (2.76× higher than single-agent baselines), 10× reduction in API call variability, and power savings up to 300.8W across deployments scaling from 8 to 35 nodes. The research has produced 5 journal publications, 3 international conference papers in IEEE venues, and 1 Elsevier book chapter. (Català) Les xarxes 6G requereixen sistemes d'orquestració capaços de gestionar milers de microserveis distribuïts sota restriccions de latència inferiors al mil·lisegon. Els enfocaments centralitzats tradicionals introdueixen retards inacceptables, generen punts únics de fallada en infraestructures heterogènies edge-cloud, i requereixen atenció constant d'operadors humans. Aquesta tesi aborda tres desafiaments crítics: (1) les restriccions computacionals que impedeixen el desplegament de models predictius en dispositius edge, (2) la manca de generalització de models entre diversos tipus d'aplicacions, i (3) l'absència d'orquestració autònoma validada sense intervenció humana. Per abordar aquests desafiaments, aquesta tesi desenvolupa tres marcs complementaris que combinen aprenentatge automàtic lleuger, aprenentatge profund basat en mecanismes d'atenció, i intel·ligència artificial agèntica per a la gestió zero-touch de serveis en entorns distribuïts 6G edge-cloud. La primera contribució, AERO (Adaptive Edge-cloud Resource Orchestration), aborda el desafiament d'executar prediccions en dispositius edge amb recursos limitats. Els models transformer actuals requereixen milions de paràmetres (p. ex., Pathformer: 2.4M), fent-los impracticables per a desplegament edge. AERO aconsegueix precisió competitiva amb només 599 paràmetres, fent viable el desplegament edge i reduint la dependència de comunicacions amb el núvol quan es prefereix inferència local. Les avaluacions demostren inferència inferior al mil·lisegon (0.38ms), 13% d'estalvi energètic, i 99% menys violacions d'SLA en comparació amb la programació reactiva, que assigna recursos només després que es produeixen canvis en la demanda. La segona contribució, OmniFORE (Framework for Optimization of Resource Forecasts in Edge-cloud networks), aborda el desafiament operacional de mantenir models separats per aplicació. Un únic model OmniFORE generalitza entre càrregues de treball heterogènies sense reentrenament, eliminant la necessitat de models dedicats per aplicació. L'avaluació creuada en benchmarks estàndard de la indústria (traces de producció de Google i Alibaba) demostra 30% millor precisió que ModernTCN mantenint inferència 15× més ràpida que AGCRN. La tercera contribució, AgentEdge, aborda el desafiament de l'orquestració agèntica en entorns distribuïts edge-cloud. Els marcs d'agents existents es dirigeixen a dominis genèrics o infraestructures cloud centralitzades, deixant els entorns 6G distribuïts sense solucions de gestió autònoma. AgentEdge introdueix orquestració multi-agent en aquest domini, traduint intencions en llenguatge natural (p. ex., "desplegar amb baixa latència") en accions d'orquestració validades sobre infraestructura heterogènia. Les avaluacions demostren 78.3% de taxa d'èxit (2.76× superior a línies base d'agent únic), reducció de 10× en variabilitat de crides API, i estalvis de potència fins a 300.8W en desplegaments escalant de 8 a 35 nodes. La recerca ha produït 5 publicacions en revistes, 3 articles en conferències internacionals en venues IEEE, i 1 capítol de llibre d'Elsevier. (Español) Las redes 6G requieren sistemas de orquestación capaces de gestionar miles de microservicios distribuidos bajo restricciones de latencia inferiores al milisegundo. Los enfoques centralizados tradicionales introducen retrasos inaceptables, generan puntos únicos de fallo en infraestructuras heterogéneas edge-cloud, y requieren atención constante de operadores humanos. Esta tesis aborda tres desafíos críticos: (1) las restricciones computacionales que impiden el despliegue de modelos predictivos en dispositivos edge, (2) la falta de generalización de modelos entre diversos tipos de aplicaciones, y (3) la ausencia de orquestación autónoma validada sin intervención humana. Para abordar estos desafíos, esta tesis desarrolla tres marcos complementarios que combinan aprendizaje automático ligero, aprendizaje profundo basado en mecanismos de atención, e inteligencia artificial agéntica para la gestión zero-touch de servicios en entornos distribuidos 6G edge-cloud. La primera contribución, AERO (Adaptive Edge-cloud Resource Orchestration), aborda el desafío de ejecutar predicciones en dispositivos edge con recursos limitados. Los modelos transformer actuales requieren millones de parámetros (ej., Pathformer: 2.4M), haciéndolos impracticables para despliegue edge. AERO logra precisión competitiva con solo 599 parámetros, haciendo viable el despliegue edge y reduciendo la dependencia de comunicaciones con la nube cuando se prefiere inferencia local. Las evaluaciones demuestran inferencia inferior al milisegundo (0.38ms), 13% de ahorro energético, y 99% menos violaciones de SLA en comparación con la programación reactiva, que asigna recursos solo después de que ocurren cambios en la demanda. La segunda contribución, OmniFORE (Framework for Optimization of Resource Forecasts in Edge-cloud networks), aborda el desafío operacional de mantener modelos separados por aplicación. Un único modelo OmniFORE generaliza entre cargas de trabajo heterogéneas sin reentrenamiento, eliminando la necesidad de modelos dedicados por aplicación. La evaluación cruzada en benchmarks estándar de la industria (trazas de producción de Google y Alibaba) demuestra 30% mejor precisión que ModernTCN manteniendo inferencia 15× más rápida que AGCRN. La tercera contribución, AgentEdge, aborda el desafío de la orquestación agéntica en entornos distribuidos edge-cloud. Los marcos de agentes existentes se dirigen a dominios genéricos o infraestructuras cloud centralizadas, dejando los entornos 6G distribuidos sin soluciones de gestión autónoma. AgentEdge introduce orquestación multi-agente en este dominio, traduciendo intenciones en lenguaje natural (ej., "desplegar con baja latencia") en acciones de orquestación validadas sobre infraestructura heterogénea. Las evaluaciones demuestran 78.3% de tasa de éxito (2.76× superior a líneas base de agente único), reducción de 10× en variabilidad de llamadas API, y ahorros de potencia hasta 300.8W en despliegues escalando de 8 a 35 nodos. La investigación ha producido 5 publicaciones en revistas, 3 artículos en conferencias internacionales en venues IEEE, y 1 capítulo de libro de Elsevier.
Universitat Politècnica de Catalunya
Title: AI-driven zero-touch orchestration of edge-cloud services
Description:
(English) 6G networks demand orchestration systems capable of managing thousands of distributed microservices under sub-millisecond latency constraints.
Traditional centralized approaches introduce unacceptable delays, create single points of failure in heterogeneous edge-cloud infrastructures, and require constant attention from human operators.
This dissertation addresses three critical challenges: (1) computational constraints that prevent the deployment of predictive models on edge devices, (2) lack of generalization of models across diverse types of applications, and (3) lack of validated autonomous orchestration without human intervention.
To address these challenges, this dissertation develops three complementary frameworks that combine lightweight machine learning, attention-based deep learning, and agentic artificial intelligence for zero-touch service management in distributed 6G edge-cloud environments.
The first contribution, AERO (Adaptive Edge-cloud Resource Orchestration), addresses the challenge of running predictions on resource-constrained edge devices.
Current transformer models require millions of parameters (e.
g.
, Pathformer: 2.
4M), making them impractical for edge deployment.
AERO achieves competitive accuracy with only 599 parameters, making edge deployment feasible and reducing reliance on cloud round-trips when local inference is preferred.
Evaluations demonstrate sub-millisecond inference (0.
38ms), 13% energy savings, and 99% fewer SLA violations compared to reactive scheduling, which allocates resources only after demand changes occur.
The second contribution, OmniFORE (Framework for Optimization of Resource Forecasts in Edge-cloud networks), addresses the operational challenge of maintaining separate models per application.
A single OmniFORE model generalizes across heterogeneous workloads without retraining, replacing the need for dedicated per-application models.
Cross-dataset evaluation on industry-standard benchmarks (Google and Alibaba production traces) demonstrates 30% better accuracy than ModernTCN while maintaining 15× faster inference than AGCRN.
The third contribution, AgentEdge, addresses the challenge of agentic orchestration in distributed edge-cloud environments.
Existing agent frameworks target generic domains or centralized cloud infrastructures, leaving distributed 6G environments without autonomous management solutions.
AgentEdge introduces multi-agent orchestration to this domain, translating natural language intent (e.
g.
, "deploy with low latency") into validated orchestration actions across heterogeneous infrastructure.
Evaluations demonstrate 78.
3% success rate (2.
76× higher than single-agent baselines), 10× reduction in API call variability, and power savings up to 300.
8W across deployments scaling from 8 to 35 nodes.
The research has produced 5 journal publications, 3 international conference papers in IEEE venues, and 1 Elsevier book chapter.
(Català) Les xarxes 6G requereixen sistemes d'orquestració capaços de gestionar milers de microserveis distribuïts sota restriccions de latència inferiors al mil·lisegon.
Els enfocaments centralitzats tradicionals introdueixen retards inacceptables, generen punts únics de fallada en infraestructures heterogènies edge-cloud, i requereixen atenció constant d'operadors humans.
Aquesta tesi aborda tres desafiaments crítics: (1) les restriccions computacionals que impedeixen el desplegament de models predictius en dispositius edge, (2) la manca de generalització de models entre diversos tipus d'aplicacions, i (3) l'absència d'orquestració autònoma validada sense intervenció humana.
Per abordar aquests desafiaments, aquesta tesi desenvolupa tres marcs complementaris que combinen aprenentatge automàtic lleuger, aprenentatge profund basat en mecanismes d'atenció, i intel·ligència artificial agèntica per a la gestió zero-touch de serveis en entorns distribuïts 6G edge-cloud.
La primera contribució, AERO (Adaptive Edge-cloud Resource Orchestration), aborda el desafiament d'executar prediccions en dispositius edge amb recursos limitats.
Els models transformer actuals requereixen milions de paràmetres (p.
ex.
, Pathformer: 2.
4M), fent-los impracticables per a desplegament edge.
AERO aconsegueix precisió competitiva amb només 599 paràmetres, fent viable el desplegament edge i reduint la dependència de comunicacions amb el núvol quan es prefereix inferència local.
Les avaluacions demostren inferència inferior al mil·lisegon (0.
38ms), 13% d'estalvi energètic, i 99% menys violacions d'SLA en comparació amb la programació reactiva, que assigna recursos només després que es produeixen canvis en la demanda.
La segona contribució, OmniFORE (Framework for Optimization of Resource Forecasts in Edge-cloud networks), aborda el desafiament operacional de mantenir models separats per aplicació.
Un únic model OmniFORE generalitza entre càrregues de treball heterogènies sense reentrenament, eliminant la necessitat de models dedicats per aplicació.
L'avaluació creuada en benchmarks estàndard de la indústria (traces de producció de Google i Alibaba) demostra 30% millor precisió que ModernTCN mantenint inferència 15× més ràpida que AGCRN.
La tercera contribució, AgentEdge, aborda el desafiament de l'orquestració agèntica en entorns distribuïts edge-cloud.
Els marcs d'agents existents es dirigeixen a dominis genèrics o infraestructures cloud centralitzades, deixant els entorns 6G distribuïts sense solucions de gestió autònoma.
AgentEdge introdueix orquestració multi-agent en aquest domini, traduint intencions en llenguatge natural (p.
ex.
, "desplegar amb baixa latència") en accions d'orquestració validades sobre infraestructura heterogènia.
Les avaluacions demostren 78.
3% de taxa d'èxit (2.
76× superior a línies base d'agent únic), reducció de 10× en variabilitat de crides API, i estalvis de potència fins a 300.
8W en desplegaments escalant de 8 a 35 nodes.
La recerca ha produït 5 publicacions en revistes, 3 articles en conferències internacionals en venues IEEE, i 1 capítol de llibre d'Elsevier.
(Español) Las redes 6G requieren sistemas de orquestación capaces de gestionar miles de microservicios distribuidos bajo restricciones de latencia inferiores al milisegundo.
Los enfoques centralizados tradicionales introducen retrasos inaceptables, generan puntos únicos de fallo en infraestructuras heterogéneas edge-cloud, y requieren atención constante de operadores humanos.
Esta tesis aborda tres desafíos críticos: (1) las restricciones computacionales que impiden el despliegue de modelos predictivos en dispositivos edge, (2) la falta de generalización de modelos entre diversos tipos de aplicaciones, y (3) la ausencia de orquestación autónoma validada sin intervención humana.
Para abordar estos desafíos, esta tesis desarrolla tres marcos complementarios que combinan aprendizaje automático ligero, aprendizaje profundo basado en mecanismos de atención, e inteligencia artificial agéntica para la gestión zero-touch de servicios en entornos distribuidos 6G edge-cloud.
La primera contribución, AERO (Adaptive Edge-cloud Resource Orchestration), aborda el desafío de ejecutar predicciones en dispositivos edge con recursos limitados.
Los modelos transformer actuales requieren millones de parámetros (ej.
, Pathformer: 2.
4M), haciéndolos impracticables para despliegue edge.
AERO logra precisión competitiva con solo 599 parámetros, haciendo viable el despliegue edge y reduciendo la dependencia de comunicaciones con la nube cuando se prefiere inferencia local.
Las evaluaciones demuestran inferencia inferior al milisegundo (0.
38ms), 13% de ahorro energético, y 99% menos violaciones de SLA en comparación con la programación reactiva, que asigna recursos solo después de que ocurren cambios en la demanda.
La segunda contribución, OmniFORE (Framework for Optimization of Resource Forecasts in Edge-cloud networks), aborda el desafío operacional de mantener modelos separados por aplicación.
Un único modelo OmniFORE generaliza entre cargas de trabajo heterogéneas sin reentrenamiento, eliminando la necesidad de modelos dedicados por aplicación.
La evaluación cruzada en benchmarks estándar de la industria (trazas de producción de Google y Alibaba) demuestra 30% mejor precisión que ModernTCN manteniendo inferencia 15× más rápida que AGCRN.
La tercera contribución, AgentEdge, aborda el desafío de la orquestación agéntica en entornos distribuidos edge-cloud.
Los marcos de agentes existentes se dirigen a dominios genéricos o infraestructuras cloud centralizadas, dejando los entornos 6G distribuidos sin soluciones de gestión autónoma.
AgentEdge introduce orquestación multi-agente en este dominio, traduciendo intenciones en lenguaje natural (ej.
, "desplegar con baja latencia") en acciones de orquestación validadas sobre infraestructura heterogénea.
Las evaluaciones demuestran 78.
3% de tasa de éxito (2.
76× superior a líneas base de agente único), reducción de 10× en variabilidad de llamadas API, y ahorros de potencia hasta 300.
8W en despliegues escalando de 8 a 35 nodos.
La investigación ha producido 5 publicaciones en revistas, 3 artículos en conferencias internacionales en venues IEEE, y 1 capítulo de libro de Elsevier.

Related Results

CANAO: A Cloud-Aware Native Agentic AI Framework for Adaptive Task Orchestration in Cloud-Native Environments
CANAO: A Cloud-Aware Native Agentic AI Framework for Adaptive Task Orchestration in Cloud-Native Environments
Agentic AI has emerged as a promising paradigm for autonomous reasoning and execution in complex AI-driven applications; however, its effective deployment in cloud-native environme...
Magic graphs
Magic graphs
DE LA TESIS<br/>Si un graf G admet un etiquetament super edge magic, aleshores G es diu que és un graf super edge màgic. La tesis està principalment enfocada a l'estudi del c...
Leveraging Artificial Intelligence for smart cloud migration, reducing cost and enhancing efficiency
Leveraging Artificial Intelligence for smart cloud migration, reducing cost and enhancing efficiency
Cloud computing has become a critical component of modern IT infrastructure, offering businesses scalability, flexibility, and cost efficiency. Unoptimized cloud migration strategi...
Decoding the Cloud Giants: A Comparison of AWS, Azure and GCP
Decoding the Cloud Giants: A Comparison of AWS, Azure and GCP
The adoption of cloud services by companies and organizations is increasingly becoming essential for enhancing competitive performance in today's business environment. Cloud servic...
Hybrid Cloud Scheduling Method for Cloud Bursting
Hybrid Cloud Scheduling Method for Cloud Bursting
In the paper, we consider the hybrid cloud model used for cloud bursting, when the computational capacity of the private cloud provider is insufficient to deal with the peak number...
Developing a Cloud Computing Framework for University Libraries
Developing a Cloud Computing Framework for University Libraries
Our understanding of the library context on security challenges on storing research output on the cloud is inadequate and incomplete. Existing research has mostly focused on profit...
THE IMPACT OF CLOUD COMPUTING ON CONSTRUCTION PROJECT DELIVERY ABUJA NIGERIA
THE IMPACT OF CLOUD COMPUTING ON CONSTRUCTION PROJECT DELIVERY ABUJA NIGERIA
Cloud computing is the delivery of computing services, such as storage, processing power, and software applications, via the internet. Cloud computing offers various advantages and...
A Survey on Hybrid and Multi-Cloud Environments: Integration Strategies, Challenges, and Future Directions
A Survey on Hybrid and Multi-Cloud Environments: Integration Strategies, Challenges, and Future Directions
The rapid evolution of cloud computing has led organizations to adopt hybrid and multi-cloud environments to meet increasing demands for scalability, flexibility, and resilience. W...

Back to Top