Optimizando un sitio web de URL extensas a URL amigables con Apache y PHP

Resumen. En este manual Ud. aprenderá cómo optimizar de manera sencilla una web dinámica hecha en PHP, cuyas URL’s pasadas a los enlaces contengan extensas variables pasadas mediante GET, a una web cuyas URL sean amigables (fáciles de recordar).

Introducción.

Los que programamos en PHP, o bajo cualquier otro lenguaje de programación orientado a web, por lo general tendemos a pasar datos de una web origen a otra destino mediante variables del tipo GET generando enlaces tal como:
http://www.tiperu.com/index.php?mod=ecommerce&producto=tienda&op=3 que difícilmente son indexadas por algunos buscadores y lo que es peor aún: son nada asimilables por un usuario común (a este grupo de URL las llamaremos URL extensas para efectos del presente artículo). Si lo vemos desde esa perspectiva justo sería afirmar que las web dinámicas tienen desventajas en ese ambito sobre las web estáticas del tipo http://www.tiperu.com/ecommerce.html que son mucho más fáciles de recordar por su simpleza y carencia de variables vía GET, a este tipo de URL las conocemos (y me referiré a ellas en adelante) como URL amigables.

Quiero dejar en claro que lejos de la división convencional entre lo que son web estáticas o dinámicas en este manual me referiré a ambas en función a la diferencia de URL especificadas en el párrafo anterior - hecha la aclaración continuo con el artículo.

Felizmente para los que usamos Apache como servidor web, conjuntamente con PHP, esto tiene solución gracias al módulo mod_rewrite (URL Rewriting Engine) que nos permitirá mediante unas cuantas reglas transformar nuestras URL extensas en URL amigables.

Si bien es altamente aconsejable aprender el correcto manejo del mod_rewrite y sus correspondientes reglas, en este artículo no se hará explicación extensiva del mismo pues su objetivo principal, y claramente detallado en el título, es mostrar al lector cómo optimizar una web de URL extensas a URL amigables; con esto quiero dejar a entender que se asume que el lector posee un website ya creado con URL extensas y desea pasarlas fácilmente a URL amigables “en un dos por tres”.

Preparando el archivo “.htaccess”.

El archivo .htaccess nos permite pasarle información al servidor Apache para que cumpla ciertas reglas de configuración en la carpeta que lo contenga, por tal motivo debemos copiar este archivo en la carpeta que contengan los archivos php en los cuales realizaremos los cambio de URL:

  1. Options +FollowSymLinks
  2. RewriteEngine on
  3. #4 variables
  4. Rewriterule ^(.*)/(.*),(.*)/(.*),(.*)/(.*),(.*)/(.*),(.*)/$ $1.php?$2=$3&$4=$5&$6=$7&$8=$9
  5. #3 variables
  6. Rewriterule ^(.*)/(.*),(.*)/(.*),(.*)/(.*),(.*)/$ $1.php?$2=$3&$4=$5&$6=$7
  7. #2 variables
  8. Rewriterule ^(.*)/(.*),(.*)/(.*),(.*)/$ $1.php?$2=$3&$4=$5
  9. #1 variable
  10. Rewriterule ^(.*)/(.*),(.*)/$ $1.php?$2=$3

En las dos primeras líneas nos aseguramos de que esté activado el mod_rewrite en el Apache (si esto no funciona deberá comunicarse con su administrador para que active el módulo en el servidor).

Las líneas antecedidas por “#”, como las 3, 5, 7 y 9 ; son simplemente comentarios, no los tome en cuenta.

En las líneas 4, 6, 8 y 10 se establecen las reglas que nos permitirán tranformas nuestras URL extensas en amigables. Analizaremos aquella que permite transformar dos variables, las demás son similares:

Rewriterule ^(.*)/(.*),(.*)/(.*),(.*)/$ $1.php?$2=$3&$4=$5

De URL extensa:
./index.php?categoria=monitores&productoID=12345

En URL amigable:
./index/categoria,monitores/productoID,12345/

Como se puede apreciar la regla tomara el nombre del script y le quitara la extensión ".php" para tomarlo como un directorio (nótese la parte en negritas):
Rewriterule ^(.*)/(.*),(.*)/(.*),(.*)/$ $1.php?$2=$3&$4=$5
./index.php?categoria=monitores&productoID=12345
./index/categoria,monitores/productoID,12345/

Seguidamente toma el primer par ?valor=variable y lo transfroma en una subcarpeta valor,variable/:
Rewriterule ^(.*)/(.*),(.*)/(.*),(.*)/$ $1.php?$2=$3&$4=$5
./index.php?categoria=monitores&productoID=12345
./index/categoria,monitores/productoID,12345/

Y finalmente hace lo propio con el par &valor=variable y lo transforma en una subcarpeta valor,variable/:
Rewriterule ^(.*)/(.*),(.*)/(.*),(.*)/$ $1.php?$2=$3&$4=$5
./index.php?categoria=monitores&productoID=12345
./index/categoria,monitores/productoID,12345/

Como ya se habra dado cuenta, los valores antecedidos por el símbolo dólar ($) en la parte de las URL extensas reemplazan a los (.*) de las URL amigables.

Bueno ya tenemos el archivo .htacces que nos permitirá lograr los resultados que deseamos a nivel del servidor, ahora procederemos a crear el script php que nos permita cambiar nuestras URL extensas en amigables sin tener que hacer ninguna modificación directa en los “N” enlaces que posea nuestro sitio web.

Generando el script en php.

El script php que se usaremos se encargará básicamente de tomar la URL extensa, si esta ha sido pasada mediante el método GET, y la transformará en una URL amigable a la cual redirecionará usando la función header. Puesto que header redirecionará hacia la misma web, y esto causará lo que se conoce como un bucle infinito, se hará uso de variables de sesión que nos ayuden a evitar tal inconveniente; por tal motivo nuestro script se seccionará en 2 partes: la primera irá en las primeras líneas de todas las páginas a las que aplicaremos el script, y la segunda parte (encargada de limpiar la variable de sesión) irá al final de las páginas. Aclarados los detalles, explicaré mediante comentarios el script php:

<? php
//Iniciamos o continuamos la sesión encargada de evitar el bucle infinito
session_name(”url_amigable”);
session_start();
//Almacenamos datos del server, script y variables (pasadas por GET)
$Server=$_SERVER[’SERVER_NAME’];
$Script=$_SERVER[’PHP_SELF’];
$Variables=$_SERVER[’QUERY_STRING’];
//Verificando si tiene variables por GET
//y no se han pasado datos mediante un form por POST
//ya q al redireccionar un post puede ocasionar errores.
//Tambien verificamos que la variable de sesión ‘Listo’
//sea diferente a 1, esto nos eviara un bucle infinito.
if(!empty($Variables) && $_SERVER[’REQUEST_METHOD’]==’GET’ && $_SESSION[’Listo’]!=1){
//Si tiene variables pasadas por GET se procede a hacer el cambio.
//1. Agrupando $Variables por “variable=valor” en el array $Variable.
$Variable=explode(”&”,$Variables);
//2. Sustituyendo “=” por “,” y concadenandolo en variable $Amigable.
for($i=0; $i < count($Variable); $i++){
$Amigable.="/".str_replace("=",",",$Variable[$i]);
}

//3. Quitando la extension “.php” a $Script para simular un directorio.
$Dir=str_replace(”.php”,”",$Script);
//4. Generando la URL Amigable.
$URL_AMIGABLE=”http://”.$Server.$Dir.$Amigable.”/”;
//5. Colocando la variable de sesión ‘Listo’ a 1 para evitar el bucle infinito
// al redireccionar la web.
$_SESSION[’Listo’]=1;
//6. Redireccionando a la url amigable
header(”Location: $URL_AMIGABLE”);
//7. Exit hará que culmine hasta este punto el script, si no estuviera ‘exit’
// el script continuaría ejecutándose y llegaría hasta el final del mismo, es decir,
// a la parte donde colocamos a la variable de sesión ‘Listo’ en cero, originandose
// entonces un bucle infinito.
exit;
}
//Cambie $_URL_BASE por la ruta raiz de su web, ya que al simular la url amigable
//directorios, hará que no muestre adecuadamente los origenes de los recursos que
//llama su página web.
$_URL_BASE=”http://”.$Server.”/pruebas/url_amigable/index.php”;
?>
<html>
<head>
<title>URL Amigables</title>
<base href = "< ? echo $_URL_BASE;?>” target=”_top” />
</ head>
<body>
<! - - Aquí el contenido de su página web - ->
</ body>
</ html>< ? php
//Limpia el posible bucle, es decir, se puede volver a hacer el envío.
$_SESSION[’Listo’]=0;
?>

Recomendaciones finales.

Como habrán podido ver el script no es complicado, y la adaptación a una web ya constituida tampoco lo será. Ya he probado la técnica en uno de mis proyectos (de manera local) y me ha funcionado bastante bien.

Lo que sí quiero aclarar es que al momento de testear esta técnica en una url de 5 variables a más me generó errores (básicamente no encuentra la url amigable generada); una url de 4 variables redireciona correctamente, pero si luego de ello refresco el navegador genera el mismo error, es decir, no (re)carga la url amigable.

Mi consejo es que usen esta técnica en una url de 3 a menos de 3 variables pasadas por GET y personalicen este script a sus necesidades. Y como es lógico, les aconsejo bastante informarse más sobre el uso del mod_rewrite en Apache, creanme que les aliviará más de un dolor de cabeza.

Finalmente les diré que pueden descargarse el script desde esta dirección: url_amigable.zip.

Autor: William Wong Garay
Fuente Original: http://willy.tiperu.com

Comments

como podria probar si funciona el .htaccess

bueno estaba probando el mod_rewrite pero hasta el momento me sale el error 404 :(
los pasos q segui son los siguientes :
primero habilite el modulo mod_rewrite de apache
luego hice lo siguiente:
#en el Archivo .htaccess

Options +FollowSymLinks
RewriteEngine On
RewriteRule concert/14set/(.+)$ /concert/14set/allmusic_edit.php?varid=$1
--------------
pagina inicial:
http://localhost/concert/14set/allmusic_edit.php?varid=1

lo que deseo:
http://localhost/concert/14set/1
------------------------
Otra cosa es q me gustaria saber si hay alguna forma de probar q lo esta reconociendo el apache el archivo .htaccess?
gracias por su respuesta

--
jose

¿Has probado los ejemplos de Apache?

Hay varios casos prácticos que vale la pena estudiar en el sitio de Apache.

También dale un vistazo a una buena referencia de regular expressions, es fundamental para lidiar con la reglas de mod_rewrite.

Si estás obteniendo error 404 es muy probable que el archivo .htaccess ya esté siendo reconocido, aunque las reglas talvez no están correctamente escritas.

Saludos.

Alexis Bellido
Como trabajar en Internet

Prueba con esto

Saludos man, prueba cambiando la siguiente linea: RewriteRule concert/14set/(.+)$ /concert/14set/allmusic_edit.php?varid=$1 por: RewriteRule ^concert/14set/([0-9]+)$ concert/14set/allmusic_edit.php?varid=$1 Se te olvido el sombrerito "^" y para los numeros era ([0-9]+), ah , no estoy completamente seguro, pero creo que el "/" inicial de la url extensa no era necesario. Exitos ----- William Wong Garay Gerente General de TIPeru COM Webmaster de Negociando por Internet Blog: http://willy.tiperu.com

Error 404

Luego de dos horas tratando me da este error en mozilla, porque en el explorer no logra darmela jaja!(se queda cargando).
"Firefox ha detectado que el servidor está redirigiendo el pedido para esta dirección en una forma que nunca se completará."

Comentario

hay bastante trabajo ahi y parece bien confexionado, pero yo no utilizaria ese metodo, porque en mi opinion no tiene ventajas.
En el caso de exhibicion de productos, es mejor encriptar las variables pasadas para evitar ataques. Este metodo deja limpia las variables para los ataques.
Es solo un comentario de buena intension he.

IntWork

Promocion de videos