Utilizar el control de asignación de campos
Cuando se fusionan varios datasets de entrada en un solo dataset de salida, se consideran el contenido y la estructura de campo. Cada dataset de entrada tendrá campos que también existen en otros datasets de entrada y campos que son exclusivos de ese dataset. La manera en que se administran estos campos determina el contenido y la estructura de campo en el dataset de salida. El control de Asignación de campos le permite definir la estructura de campo de este dataset de salida.
Todos los campos del dataset de entrada se asignarán al dataset de salida. Cuando hay duplicación de campo (basada sólo en el nombre) entre todas las entradas, el campo del dataset de salida será la combinación de cada ocurrencia. Todos los campos únicos del dataset de entrada (aquellos que no se encuentran en otros datasets de entrada) también se asignan al dataset de salida.
Es posible que los subcampos de una asignación de campos sean de tipos de datos variados. En este caso, el tipo de datos del campo de salida se establece como el tipo de datos del primer dataset de entrada, y todos los otros subcampos se convierten a este tipo. Por ejemplo, el primer campo de entrada es de texto, y el segundo campo de entrada (del mismo nombre) es doble. El tipo de datos de salida será de texto, y los valores en el segundo campo de entrada se convertirán a este tipo. Puede haber ocasiones en que la conversión no sea posible y se produzcan errores durante la ejecución que indiquen dónde se encuentra el problema. Por ejemplo, un campo BLOB no puede convertirse a cualquier tipo de datos que no sea BLOB. Además, si se va a convertir un campo alfanumérico a tipo numérico, hay que truncarlo (con especificación del punto inicial y final) para quitar la parte alfabética de sus valores.
La asignación de campos se muestra gráficamente en un árbol de catálogo. Todas las entradas de raíz (nivel superior) son los campos del dataset de salida. Podrá ver los nombres y los tipos de datos de salida predeterminados. El tipo de datos de campo de salida predeterminado es el mismo que el tipo de datos de la primera entrada.
Cada entrada de nivel de raíz es expandible. Cuando se expande, muestra todos los subcampos de los que se obtendrán datos para completar el campo de salida. Para cada ocurrencia de un campo (por nombre) en el dataset de entrada, aparecerá una entrada de subcampo que muestra sus tipos de datos y origen. La ocurrencia de un campo del primer dataset de entrada será la primera en aparecer en la lista de subcampos.
Esta es la estructura predeterminada de los campos de datasets de salida. En cualquier momento, puede agregar o eliminar datasets de entrada; agregar, eliminar o renombrar campos de datasets de salida y agregar, eliminar, renombrar o personalizar subcampos.
Modificar las asignaciones de campos predeterminadas
La estructura de la asignación de campos predeterminada se puede modificar en cualquier momento. Se pueden agregar, eliminar o renombrar los campos de salida. También se pueden agregar, eliminar o renombrar los subcampos, y se puede dar formato a los campos de salida de texto. En la vista de árbol de la asignación de campos, se pueden utilizar menús de acceso directo (a los que se accede haciendo clic con el botón derecho del ratón en un campo o subcampo seleccionado, o en el espacio en blanco) para realizar estas modificaciones.
El menú de acceso directo para los campos de salida tiene las siguientes opciones: Agregar campo de entrada, Eliminar, Renombrar y Propiedades.
- La opción Agregar campo de entrada abre un cuadro de diálogo que enumera todos los campos del dataset de entrada. Si elige un campo disponible, se agrega a la lista seleccionada de subcampos de campos de salida.
- La opción Eliminar quita el campo seleccionado del dataset de salida.
- La opción Renombrar le permite cambiar el nombre del campo de salida.
- La opción Propiedades le permite cambiar las propiedades del campo seleccionado. Puede cambiar el nombre, el tipo, las propiedades de tipo, la regla de fusión y el delimitador del campo (si la regla de fusión Unir está seleccionada).
El menú de acceso directo para los subcampos tiene las siguientes opciones: Eliminar y Formato (sólo campos de texto).
- La opción Eliminar quita el subcampo seleccionado. Si se elimina el primer subcampo, el tipo de datos del campo de salida no se modificará para reflejar el nuevo primer subcampo de posición. Si quiere cambiar el tipo de datos del campo de salida, debe hacerlo manualmente (con el cuadro de diálogo Propiedades), o puede utilizar la opción Restaurar en el menú contextual de la ventana de asignación de campos.
- La opción Formato le permite cambiar el ancho de campo, la posición de inicio y de fin, y luego aplicar los cambios a todos los subcampos del mismo nombre.
Si se disminuye el ancho de campo, se truncarán los valores de fila de salida para que quepan. También se produce este truncamiento si se alteran los valores del punto de inicio y final. El valor Posición de inicio es el punto de inicio a partir del cual se truncarán los valores de fila. Los valores de ancho de fila comienzan en cero.
Los valores más largos que el valor de la Posición final serán truncados en el punto especificado. Por ejemplo, un campo de texto con un valor de fila de "entorno", un ancho de 12, una posición de inicio de 3 y una posición final de 7, aparecerá en el campo de salida como "ironm".
El menú de acceso directo del panel de asignación de campos (espacio en blanco) tiene las siguientes opciones: Agregar el campo de salida y Restaurar.
- La opción Agregar el campo de salida le permite agregar un nuevo campo. Se abre un cuadro de diálogo secundario que le permite cambiar el nombre, el tipo de datos, las propiedades de tipo de datos, la regla de fusión y el delimitador (si la regla de fusión Unir está seleccionada).
- La opción Restaurar restablecerá todas las propiedades de campo de salida a los valores predeterminados. Se quitarán todas las modificaciones.
Reglas de fusión
Cada campo de salida le permite establecer ciertas propiedades, como el nombre, el tipo y la regla de fusión. Las reglas de fusión le permiten especificar cómo los valores de dos o más campos de entrada (subcampos) se fusionan en un único valor de salida. Los valores nulos se excluyen de todos los cálculos estadísticos. Existen varias reglas de fusión que puede utilizar:
- Primero: utiliza los valores del primer subcampo para completar las filas del campo de salida.
- Último: utiliza los valores del último subcampo para completar las filas del campo de salida.
- Unión: concatena (une) todos los valores de subcampo y utiliza este valor para completar las filas del campo de salida. Puede utilizar un delimitador para separar los distintos valores de entrada. Si no utiliza un delimitador, todos los valores se unirán en una cadena de caracteres continua.
- Suma: calcula el total de todos los valores de subcampo, luego lo divide por el número de subcampos de entrada.
- Media: calcula el valor medio (promedio) de todos los valores de subcampo y utiliza el resultado para completar las filas del campo de salida.
- Mediana: calcula el valor mediano (centro) y lo utiliza para completar las filas del campo de salida. La mediana es el valor central que separa el conjunto total de valores en mitades inferiores y superiores. Si hay un número par de valores, se utilizará el promedio de los dos valores centrales. Por ejemplo, la mediana de 1, 6, 7, 100 es 6,5.
- Modo: utiliza el valor con la mayor frecuencia (el más común). Si hay más de un valor con la mayor frecuencia (es decir, un empate), se ordenará la lista de valores de Modo (primero los más pequeños para numérico, alfabético para texto), y se utilizará el primero.
- Mín: encuentra el valor mínimo de todos los subcampos y lo utiliza para completar las filas del campo de salida.
- Máx: encuentra el valor máximo de todos los subcampos y lo utiliza para completar las filas del campo de salida.
- Desviación estándar: utiliza el método de clasificación de la desviación estándar en todos los valores de subcampo.
No debe realizarse la desviación estándar en una sola entrada porque los valores no se pueden dividir por cero, por lo que esta no es una opción válida para las entradas individuales. La herramienta Fusionar no fallará si se elige la desviación estándar para un campo de salida que sólo tiene un único subcampo. En este caso, se introducirá un valor cero en las filas del campo de salida.
- Contar: busca la cantidad de valores incluidos en los cálculos estadísticos. Esto cuenta todos los valores excepto los valores nulos.
Establecer el parámetro de Asignación de campos en una secuencia de comandos
En una secuencia de comandos, se puede realizar una asignación de campos de una de las siguientes maneras:
- Introducir un valor de cadena de caracteres para un parámetro de asignación de campos: se recomienda sólo cuando la cantidad de campos es pequeña y se requiere poca (o ninguna) alteración de los campos.
- Crear y utilizar un objeto FieldMappings.