Explicación sencilla JOINS en MySQL

JOINS en MySQL bien explicado. Todo lo que necesitas saber

El mundo de las bases de datos a veces se puede volver un poco complicado, sobretodo con el tema de las tablas relacionales. Precisamente por eso voy a enseñarte cómo funcionan los joins y cómo usarlos correctamente, a ver si nos hacemos masters.

Si has terminado aquí es porque igual que yo has dado mil vueltas por internet tratando de entender como funcionan. El problema es que la mayoría de las fuentes tienen información casi especializada.

Al final, tras conseguir aprender cómo hacer joins en mysql, me gustaría compartirlo de forma más amena. Además, si te queda cualquier duda no te lo pienses y déjame un comentario, te echaré un cable encantado.

Qué es un JOIN en MySQL

Los JOIN son usados en una sentencia SQL para recuperar datos de varias tablas al mismo tiempo. Estas tablas tienen que estar relacionadas de alguna forma, por ejemplo, una tabla usuarios, y otra tabla juegos que contiene también la id del usuario al que pertenece el juego:

Tabla Usuarios:

IDusername

Tabla Juegos:

IDjuegonameID_usuario

Como puedes observar, podríamos asociar cada juego a un usuario mediante su ID. De esta forma con un JOIN uniríamos las dos tablas y extraeríamos en una sola consulta por ejemplo:

  • username
  • juegoname

¿Qué son las tablas relacionales?

Bueno, este punto lo meto por que el ejemplo de arriba es lo básico, pero en temas de rendimiento o escalabilidad es bastante limitado.

Las tablas relacionales, son tablas que se utilizan como intermediarios de otras dos tablas. Normalmente contienen solamente la id de cada uno de los elementos de otras tablas a asociar, y será con lo que trabajaremos para entender los JOINS.

No porque sea mi capricho, es que casi siempre te lo encontrarás de esta manera cuando trabajes con bases de datos MySQL.

Un ejemplo sacado del de arriba sería tener 3 tablas, usuarios, juegos y juegousuario (para seguir un poquito las convenciones).

Tabla usuario:

IDusername

Tabla juegos:

IDjuegoname

Tabla juegousuario:

ID_usernameID_juegoname

Ahora piénsalo detenidamente. Si tienes una tabla con todos los juegos que existen, y otra tabla con 200 usuarios, bastará con que cada usuario elija los juegos que tiene. Entonces tú guardas el id de ese usuario y el id del juego que tiene, y un mismo usuario puede tener varios juegos, o varios usuarios tener un juego en concreto.

Lo solucionaríamos con un doble JOIN que devolverá los usuarios y juegos por los parámetros que le hayamos pedido.

Datos de ejemplo

Por si quieres trastear, voy a dejarte aquí una consulta completa con estructura de tabla y datos para que la importes en una base de datos y puedas jugar con ella.

SET FOREIGN_KEY_CHECKS=0;

-- ----------------------------
-- Table structure for juegos
-- ----------------------------
DROP TABLE IF EXISTS `juegos`;
CREATE TABLE `juegos` (
`ID` int(11) NOT NULL AUTO_INCREMENT,
`juegoname` varchar(255) DEFAULT NULL,
PRIMARY KEY (`ID`)
) ENGINE=InnoDB AUTO_INCREMENT=8 DEFAULT CHARSET=utf8;

-- ----------------------------
-- Records of juegos
-- ----------------------------

INSERT INTO `juegos` VALUES ('1', 'Final Fantasy VII');
INSERT INTO `juegos` VALUES ('2', 'Zelda: A link to the past');
INSERT INTO `juegos` VALUES ('3', 'Crazy Taxy');
INSERT INTO `juegos` VALUES ('4', 'Donkey Kong Country');
INSERT INTO `juegos` VALUES ('5', 'Fallout 4');
INSERT INTO `juegos` VALUES ('6', 'Saints Row III');
INSERT INTO `juegos` VALUES ('7', 'La taba');

-- ----------------------------
-- Table structure for juegousuario
-- ----------------------------
DROP TABLE IF EXISTS `juegousuario`;
CREATE TABLE `juegousuario` (
`ID_usuario` int(11) NOT NULL,
`ID_juego` int(11) NOT NULL,
UNIQUE KEY `id_user_juego` (`ID_usuario`,`ID_juego`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;

-- ----------------------------
-- Records of juegousuario
-- ----------------------------
INSERT INTO `juegousuario` VALUES ('1', '1');
INSERT INTO `juegousuario` VALUES ('1', '2');
INSERT INTO `juegousuario` VALUES ('1', '3');
INSERT INTO `juegousuario` VALUES ('1', '4');
#INSERT INTO `juegousuario` VALUES ('1', '5');
INSERT INTO `juegousuario` VALUES ('1', '6');
INSERT INTO `juegousuario` VALUES ('1', '7');
INSERT INTO `juegousuario` VALUES ('2', '3');
INSERT INTO `juegousuario` VALUES ('2', '7');
INSERT INTO `juegousuario` VALUES ('4', '1');
INSERT INTO `juegousuario` VALUES ('4', '2');
INSERT INTO `juegousuario` VALUES ('4', '4');
INSERT INTO `juegousuario` VALUES ('4', '7');

-- ----------------------------
-- Table structure for usuarios
-- ----------------------------
DROP TABLE IF EXISTS `usuarios`;
CREATE TABLE `usuarios` (
`ID` int(11) NOT NULL AUTO_INCREMENT,
`username` varchar(255) DEFAULT NULL,
PRIMARY KEY (`ID`)
) ENGINE=InnoDB AUTO_INCREMENT=5 DEFAULT CHARSET=utf8;

-- ----------------------------
-- Records of usuarios
-- ----------------------------
INSERT INTO `usuarios` VALUES ('1', 'vichaunter');
INSERT INTO `usuarios` VALUES ('2', 'pepito');
INSERT INTO `usuarios` VALUES ('3', 'jaimito');
INSERT INTO `usuarios` VALUES ('4', 'ataulfo');
SET FOREIGN_KEY_CHECKS=1;

Recordarte que estoy ignorando todos los parámetros de rendimiento y demás porque no es de lo que se trata el tema. Solo un unique index para que no haya propietarios repetidos en la tabla relacional. Si luego te interesa podemos revisar tu estructura.

¿Qué tipos de join existen?

Ahora es cuando empieza la parte divertida, la teoría o el tocho, pero voy a ver si lo puedo hacer de forma amena.

Tenemos varios tipos de JOINS, los vamos a ver uno por uno y cada uno de ellos te servirá para extraer los datos de una forma específica. Dependiendo de lo que necesites tendrás que echar mano de uno u otro, o incluso combinarlos entre ellos, que es lo más complejo.

Léete también  Qué es la estructura web semántica HTML5 y por qué usarla

Cómo usar INNER JOINS y para qué sirven

Vale, empezaremos por los más estándar. Los puedes encontrar en el código como INNER JOIN o simplemente JOIN. Este tipo de unión te ayuda a combinar varias tablas, y te devuelve únicamente los datos que estén disponibles en todas las tablas a la vez.

inner-join-diagrama

Esto significa, que si por ejemplo haces un INNER JOIN para ver los juegos que tiene cada usuario, solo devolverá datos siempre que un juego pertenezca a un usuario. Si un juego no tiene ningún propietario, pero existe en la tabla, no aparecerá, y si un usuario no tiene ningún juego asociado tampoco verás a ese usuario.

La consulta sería algo así:

SELECT
usuarios.username,
juegos.juegoname
FROM
usuarios
INNER JOIN juegousuario ON usuarios.ID = juegousuario.ID_usuario
INNER JOIN juegos ON juegousuario.ID_juego = juegos.ID

Como puedes ver, al utilizar una tabla relacional tienes que hacer dos joins. El primer JOIN nos une la tabla usuarios, con la tabla juegousuario. Ahora que ya la tenemos unida, podemos utilizar los datos de la tabla juegousuario, y lanzar la consulta con la tabla juegos en otro JOIN.

Como este join devuelve solo los datos que hay en las dos tablas, esperamos un resultado como este:

vichaunterFinal Fantasy VII
vichaunterZelda: A link to the past
vichaunterCrazy Taxy
vichaunterDonkey Kong Country
vichaunterSaints Row III
vichaunterLa taba
pepitoCrazy Taxy
pepitoLa taba
ataulfoFinal Fantasy VII
ataulfoZelda: A link to the past
ataulfoDonkey Kong Country
ataulfoLa taba

Como puedes ver, no hay ni rastro del usuario jaimito, ni del juego Fallout 4, pues ni el uno tiene juegos, ni el juego es de nadie.

Por supuesto esta consulta la podemos hacer simplemente con dos tablas, evitando una relacional. En una tienda de alquiler, en la que solo hay un juego de cada, bastaría con poner un campo id_usuario a cada juego como en la primera tabla, y hacer solo un join.

Cómo usar un LEFT JOIN

En este caso, el left join devuelve todos los resultados que coincidan en la primera tabla, con los datos que tenga de la segunda. En el caso de que falte algún dato, devolverá un valor null en lugar del dato, pero seguiremos teniendo el valor de la primera tabla.

left-join-diagrama

Por ejemplo, si quieres saber todos los juegos de los usuarios, con un left join tendremos una lista completa de todos los usuarios, incluso si no tienen ningún juego.

SELECT
usuarios.username,
juegos.juegoname
FROM
usuarios
LEFT JOIN juegousuario ON usuarios.ID = juegousuario.ID_usuario
LEFT JOIN juegos ON juegousuario.ID_juego = juegos.ID

El resultado sería el siguiente:

vichaunterFinal Fantasy VII
vichaunterZelda: A link to the past
vichaunterCrazy Taxy
vichaunterDonkey Kong Country
vichaunterSaints Row III
vichaunterLa taba
pepitoCrazy Taxy
pepitoLa taba
jaimito
ataulfoFinal Fantasy VII
ataulfoZelda: A link to the past
ataulfoDonkey Kong Country
ataulfoLa taba

Si te fijas, ahora sí que tenemos a jaimito, pero sin embargo nos muestra que no hay juego. Esto puede ser muy útil, por ejemplo para localizar todos los usuarios que no tienen juegos (con un WHERE juegoname IS NULL, por ejemplo).

Cómo usar un RIGHT JOIN

En el caso del RIGHT JOIN, pasa exactamente lo mismo que con el anterior, pero con la diferencia de que devuelve todos los datos de la tabla con la que se relaciona la anterior. Si estamos ejecutando un SELECT en la tabla usuarios, las demás serán tablas con las que se relaciona.

right-join-diagrama

Por ejemplo, supon que quieres saber todos los juegos que tienes, y a qué usuarios pertenecen (o simplemente si le pertenece a algún usuario). Lo harías de esta forma:

SELECT
usuarios.username,
juegos.juegoname
FROM
usuarios
RIGHT JOIN juegousuario ON usuarios.ID = juegousuario.ID_usuario
RIGHT JOIN juegos ON juegousuario.ID_juego = juegos.ID

Con inesperados resultados:

vichaunterFinal Fantasy VII
ataulfoFinal Fantasy VII
vichaunterZelda: A link to the past
ataulfoZelda: A link to the past
vichaunterCrazy Taxy
pepitoCrazy Taxy
vichaunterDonkey Kong Country
ataulfoDonkey Kong Country
Fallout 4
vichaunterSaints Row III
vichaunterLa taba
pepitoLa taba
ataulfoLa taba

¡Ahora han cambiado las tornas! Como puedes observar, ya no hay ni rastro de jaimito, pero sin embargo aparece Fallout 4 sin estar asociado a ningún usuario. Esto realmente tiene muchas aplicaciones interesantes, solo hay que echarle imaginación.

Cómo usar OUTER JOIN o FULL OUTER JOIN

El OUTER JOIN consiste en recuperar TODOS los datos que haya en ambas tablas, tanto los que tienen contenido en ambos extremos, como los que no. Es la oveja negra en MySQL, ya que no es directamente compatible, pero sí se puede conseguir un efecto similar.

outer-join-diagrama

Para poder hacer este tipo de consultas tendrás que echar mano de UNION, que sirve precisamente para combinar los resultados de varios SELECT en una sola consulta (¿nunca lo has usado? es como hacer trampa).

SELECT
usuarios.username,
juegos.juegoname
FROM
usuarios
LEFT JOIN juegousuario ON usuarios.ID = juegousuario.ID_usuario
LEFT JOIN juegos ON juegousuario.ID_juego = juegos.ID

UNION

SELECT
usuarios.username,
juegos.juegoname
FROM
usuarios
RIGHT JOIN juegousuario ON usuarios.ID = juegousuario.ID_usuario
RIGHT JOIN juegos ON juegousuario.ID_juego = juegos.ID

Como seguro que ya te habrás fijado, la norma para poder utilizar UNION, es que en todos los SELECT debe haber los mismos campos seleccionados. En este caso username y juegoname, ya que si no no funcionará.

Léete también  Cómo importar y exportar archivos sql y gz a mysql y mariadb

Esta consulta devolvería:

vichaunterFinal Fantasy VII
vichaunterZelda: A link to the past
vichaunterCrazy Taxy
vichaunterDonkey Kong Country
vichaunterSaints Row III
vichaunterLa taba
pepitoCrazy Taxy
pepitoLa taba
jaimito
ataulfoFinal Fantasy VII
ataulfoZelda: A link to the past
ataulfoDonkey Kong Country
ataulfoLa taba
Fallout 4

 

Como ves salen todos los datos, incluso los que no tienen nada en uno de los lados. De esta forma puedes crear varios filtros distintos después de extraerlos por ejemplo. Así con una única consulta a la base de datos tendrías todo lo que necesitas.

Entendiendo los JOINS

Vale, guay, muy bonito todo lleno de circulitos, consultas y tal, pero aún puedes tener alguna duda. ¿Por qué está haciendo las consultas con dos joins? ¿se pueden hacer con uno solo? ¿y si voy a juntar 4 tablas cómo lo hago?

Tranquilo, como comentaba en el título trato de dar una explicación de joins que se entiende, pero antes necesitábamos la base. Hasta ahora al menos ya sabes los tipos de joins que hay, y los datos que devuelve cada uno.

Si no es así, pégale un repaso a la sección anterior, y si aun así te quedan dudas puedes dejar un comentario.

Explicación del código de un join

Empezaré por lo más importante, la respuesta a la pregunta de cómo leches salen los datos de las tablas para usarse. Bien, cogeré una consulta de las primeras, a lo facilito:

SELECT
usuarios.username,
juegos.juegoname
FROM
usuarios
INNER JOIN juegousuario ON usuarios.ID = juegousuario.ID_usuario
INNER JOIN juegos ON juegousuario.ID_juego = juegos.ID

Veamos, diseccionaré toda la consulta SQL por si las dudas. Cada parte sirve para lo siguiente:

SELECT
usuarios.username,
juegos.juegoname

Aquí estás especificando que lo que quieres hacer es seleccionar datos (o un SELECT), en el que indicas los campos que quieres que devuelva, en el formato nombretabla.nombrecampo. De esta forma el select sabe de qué tabla coger el dato, ya que por ejemplo la columna ID se llama igual en las dos.

FROM
usuarios

El from indica la tabla principal a partir de la cual vamos a empezar a estraer datos, y de la que cogeremos un campo para relacionarla con otra tabla.

INNER JOIN juegousuario ON usuarios.ID = juegousuario.ID_usuario

Aquí empieza la fiesta. INNER JOIN es el tipo de join que quieres hacer, ya has visto que puede ser INNER, LEFT o RIGHT.

Lo siguiente será indicarle sobre qué tabla queremos que coja los datos, en este caso la tabla juegousuario (que es nuestra relacional).

Bien, a partir de ahí el ON, sería algo así como un where, donde indicamos, el campo de nuestra tabla inicial (la del from) con el campo que relaciona, y la tabla sobre la que vamos a combinar datos, con su campo relacionado.

En este caso la ID en la tabla usuarios coincidirá con ID_usuario, en la tabla juegousuario. En ese momento los campos de esa tabla que tengan coincidencias pasarán a poderse utilizar dentro de la consulta, por ejemplo en el SELECT para mostrarlos, o como hemos hecho aquí en el siguiente join para unirla con una tercera tabla.

INNER JOIN juegos ON juegousuario.ID_juego = juegos.ID

Empezamos como antes, pero ahora sobre la tabla juegos. Lo siguiente que quieres hacer es de la tabla juegousuario (que tiene la id del usuario y la del juego), nos busque los juegos con esa ID. Como esos datos de juegousuario han quedado disponislbes en el primer join para toda la consulta, podemos usarlos aquí o en cláusulas where, etc.

Por tanto, pasa lo siguiente:

Seleccionamos unos datos, de la tabla usuarios. Unimos la tabla usuarios a la tabla juegousuario para saber las ids de los juegos que tiene cada usuario. Luego simplemente unimos esa tabla juegousuario a la tabla juegos mediante esas ids que están ligadas al usuario.

El resultado es una lista del tipo que hayamos elegido, con relaciones entre usuarios y juegos.

¿Puedo meter más de 3 tablas?

¡Por supuesto! Puedes hacer joins con las tablas que quieras, siempre que tu servidor aguante la carga. Piensa que cuantas más tablas metas en el join, y más datos tengan, más lenta será la consulta, o incluso puede saturar el servidor.

Un ejemplo de consulta con más joins, sería si por ejemplo queremos añadir categorías a los juegos y mostrarlos en la lista de usuario-juego-categoría. Voy a suponer que para esto tenemos una columna ID_categoría en la tabla juegos.

SELECT
usuarios.username,
juegos.juegoname,
categoria.catname
FROM
usuarios
INNER JOIN juegousuario ON usuarios.ID = juegousuario.ID_usuario
INNER JOIN juegos ON juegousuario.ID_juego = juegos.ID
INNER JOIN categorias ON juegos.ID_categoria = categorias.ID

Como ves, con solo añadir una línea, y el campo en el select hemos hecho que nos devuelva también el nombre de categoría para esa consulta.

Léete también  Diferencias entre NULL, 0, false y "" bien explicado [php]

¿Y un join con solo dos tablas?

También puedes hacerlo, de hecho te pongo este ejemplo basado en el esquema que serían las tablas de la sección qué es un join en MySQL (la primera del todo).

En ese caso la consulta se uniría directamente con la ID del usuario y el campo ID_usuario de la tabla juegos.

SELECT
usuarios.username,
juegos.juegoname
FROM
usuarios
INNER JOIN juegos ON usuarios.ID = juegos.ID_usuario

Tendrías los datos de los usuarios, y de los juegos que tiene cada uno. El problema de este tipo de tablas, es que suele estar limitado a un registro por cada relación, es decir, que no podrías asignar varios juegos a un solo usuario a no ser que tuvieras más campos en tabla, o lo procesaras luego en php por ejemplo.

Entonces, ¿Cómo uso los joins?

Si te estás haciendo esta pregunta no he sido todo lo claro que pretendía. Te rogaría me dejaras un comentario con tus dudas, te las explico y mejoraré el contenido del artículo en consecuencia.

La idea es que dependiendo de lo que necesites extraer de la base de datos usarás unos u otros.

Si vas a hacer unas tablas con relaciones simples 1 a 1 (1:1), bastaría con que uses el modelo del principio con un solo join.

En caso de que quieras utilizar otras relaciones tendrás que echar mano de una tabla relacional y hacer consultas con varios joins. En relaciones del tipo:

  • 1 a muchos (1:n)
  • muchos a 1 (n:1)
  • muchos a muchos (n:n)

Estos tipos de relaciones, que son los que he usado en los demás ejemplos, te dan mucha más versatilidad. Te permiten que la relacional sirva para cualquiera de los 3 casos, ya que las limitaciones las pondrás en el código, y una asociación nueva será tan simple como añadir un campo con las ids.

Vale, hasta aquí si lo has ido pillando todo vamos bien, pero queda una duda que no se suele explicar en ningún sitio.

¿Se pueden utilizar varios JOIN diferentes en una misma consulta?

Sí, por supuesto. Puedes utilizar los joins que mejor te convenga para conseguir los resultados que te hacen falta. Dependiendo del que utilices se aplicarán las reglas que hemos visto arriba en cada JOIN.

Por ejemplo, supongamos que tenemos que unir varias tablas, y que terminamos con una consulta similar a esta:

SELECT *
FROM
contrataciones.empleado e
INNER JOIN persona.contacto c ON c.ID_contacto = e.ID_contacto
LEFT JOIN contrataciones.candidato dc ON dc.ID_empleado = e.ID_empleado
INNER JOIN ventas.vendedor vv ON vv.ID_vendedor = e.ID_empleado
LEFT JOIN ventas.orden vo ON vo.ID_personaventas = vv.ID_vendedor
LEFT JOIN ventas.zona vz ON vz.ID_zona = vv.ID_zona

A simple vista puede parecer un lío, pero si la explicamos detenidamente verás toda la lógica. Como puedes observar se hacen uso de INNER y LEFT para extraer los datos, dependiendo de los que hace falta en cada caso.

JOIN 1: El primer join une a los empleados y contactos. Esta nos devolverá solo a los empleados que tengan contactos (o datos en ambas tablas).

JOIN 2: Al hacer un LEFT en este caso se mantendrán todos los resultados del primer join, y se añadirán los datos sobre contrataciones para cada uno de los empleados que ya teníamos.

JOIN 3: En este se unen los vendedores al resultado del join anterior (recuerda que va en cascada), y al ser un INNER se eliminarán los resultados de antes que no tuvieran valores en los dos campos usados en la consulta.

JOIN 4: Otro OUTER, en este caso extrayendo todas las filas del resultado anterior y las ventas, pero haya coincidencias o no en la tabla de ventas.

JOIN 5: Igual que la consulta de antes, está pensada para añadir las zonas a los datos que ya tenemos, pero sin omitir ninguno de los vendedores, tengan esos territorios o no.

Así puede que parezca un poco confuso, pero si juegas un poco con ellos en seguida verás qué datos filtra cuando cambias un left por right por ejemplo (que haría que eliminara los que no tengan dato a la derecha, pero sí puedan tener vacío a la izquierda.

Reuerda que también puedes hacer joins con una sola tabla, por ejemplo si tienes un valor parent por ejemplo. Puedes ir escalando un nivel con cada join left y así conseguir devolver todos los niveles de categorías. Pruébalo y me cuentas.

¿Te ha quedado claro como funcionan los joins y como usarlos? Comenta y comparte


AYUDANOS a poder seguir dando respuestas. Te podemos echar una mano y tú también a nosotros, símplemente dale a me gusta.