Root NationmacioComentários de serviçosRevisão intermediária: Criando imagens geradas por IA

Revisão intermediária: Criando imagens geradas por IA

-

Você já sonhou em transferir facilmente imagens da sua imaginação para o papel? Isso agora é possível graças a geradores de imagens como o Midjourney.

Quer você seja um artista talentoso ou não tenha nenhuma experiência com pincéis, agora você pode criar obras-primas. Ou seja, graças à inteligência artificial, você pode em poucos minutos criar imagens que antes ficavam apenas na sua cabeça. Basta descrevê-los em palavras e em um momento a imagem estará pronta. Tudo isso graças a um serviço interessante Meio da jornada, que cria imagens geradas por inteligência artificial. Intrigado? Então sugiro que você descubra com mais detalhes o que é Midjourney, como funciona e todas as informações mais importantes sobre esta ferramenta de inteligência artificial.

Leia também: Testei e entrevistei o chatbot do Bing

Meio da jornada: o que é?

Do Papa Francisco com uma jaqueta brilhante aos pôsteres de filmes inspirados em Wes Anderson, as imagens geradas por IA estão se tornando cada vez mais comuns na Internet. É fácil perceber porquê: as ferramentas modernas de IA tornaram-se tão convincentes que as fotografias que criam ganharam até prestigiados prémios fotográficos.

Meio da jornada

Midjourney é um exemplo de inteligência artificial generativa que pode criar gráficos baseados em instruções textuais. Este é apenas um dos muitos geradores de imagens baseados em aprendizado de máquina que surgiram recentemente. Apesar disso, Midjourney se tornou uma das maiores e mais populares ferramentas de IA do gênero, junto com DALL-E e Stable Diffusion.

Você não precisa de nenhum hardware ou software especial para usar o Midjourney porque ele funciona por meio do aplicativo de bate-papo Discord. A única desvantagem? Então ele é. É a necessidade de pagar uma certa quantia para começar a gerar imagens que diferencia o Midjourney da maioria das soluções concorrentes, que geralmente oferecem pelo menos alguma geração gratuita de imagens.

Porém, utilizar o Midjourney é extremamente fácil e acessível a qualquer pessoa, pois o custo não é muito alto e os resultados obtidos podem ser verdadeiramente surpreendentes.

Também interessante: A artilharia moderna é a super arma da Ucrânia. E por que Elon Musk está aqui?

História de origem do Midjourney

Ao contrário do DALL-E, que é apoiado pelo desenvolvedor do Chat GPT, o Midjourney se descreve como um projeto independente e autofinanciado. O serviço foi fundado por David Holtz, que também é cofundador da Leap Motion, uma conhecida startup de realidade virtual e aumentada que foi adquirida pela UltraHaptics em 2019.

- Propaganda -

Meio da jornada

A equipe Midjourney inclui figuras proeminentes como Jim Keller (engenheiro de processador Apple, AMD, Tesla, Intel e coautor de x86-64), Nat Friedman (CEO do Github e presidente da Fundação GNOME) e Philip Rosedale (fundador do Second Life).

Meio da jornada

O desenvolvimento de IA de textos e imagens de Midjourney começou em beta fechado, que foi então movido para beta aberto em julho de 2022. Isso permitiu que o público acessasse e utilizasse a ferramenta. Foi essa mudança que ajudou o serviço Midjourney a ganhar popularidade. Ao contrário de outras ferramentas de IA, o Midjourney foi rentável já em agosto de 2022, confirmando o seu sucesso no mercado.

Também interessante: ChatGPT: instruções simples de uso

Como usar o Midjourney?

Usar o Midjourney pode parecer um pouco complicado no início. Especialmente porque os criadores tomaram uma decisão incomum. Ou seja, em vez de um aplicativo dedicado para geração de imagens, obtemos um link para um bot Discord chamado Midjourney Bot. Então, vamos percorrer todos os passos que você precisa seguir para criar um gráfico usando a ferramenta Midjourney.

Inscreva-se no Discord

Para começar com o Midjourney, você deve ter uma conta Discord. Discord é um aplicativo de bate-papo semelhante ao Slack. Embora tenha sido originalmente desenvolvido para jogadores que precisam coordenar táticas enquanto jogam jogos online multijogador, como League of Legends e World of Warcraft, agora também é extremamente popular entre outras comunidades.

Então, como você pode ver, antes de usar o Midjourney, você precisa criar uma conta no Discord. É de graça. Visite a página do Discord para se inscrever. Pronto, siga todos os passos de acordo com as instruções que irão aparecer. Se você já possui ou acabou de criar uma conta Discord, pode pular para a próxima etapa.

Inscreva-se no Midjourney

Depois de configurar sua conta Discord, vá para Midjourney e clique em “Join Beta”. Um convite para ingressar no canal Midjourney Discord será aberto. Clique em “Aceitar convite”.

Como membro gratuito, você não poderá criar imagens, mas poderá visualizar a interface. Você também pode ver as criações de outros usuários visitando as diferentes salas (chamadas #newbies-14 e #newbies-21) para entender como funciona o Midjourney.

Inscreva-se no Midjourney

Para começar a gerar imagens com Midjourney, você precisa adquirir uma assinatura. Para fazer isso, visite Midjourney.com/account, faça login com sua conta verificada do Discord e escolha o plano de assinatura que atende às suas necessidades. Escreveremos sobre os preços dos planos individuais posteriormente no texto.

Junte-se ao servidor Midjourney Discord

Depois de ingressar no servidor Midjourney Discord e assinar um plano, você pode começar a gerar imagens. Siga esses passos:

  • Abra o Discord e certifique-se de selecionar o servidor Midjourney no menu à esquerda.
  • Você deverá ver uma longa lista de canais no lado esquerdo da tela.
  • Escolha um dos canais que começa com “novatos”. Talvez seja necessário rolar a lista para baixo para encontrá-lo.
  • Você pode percorrer o feed para ver quais dicas outros usuários usaram para criar imagens.

Como gerar comandos

No canal iniciante ou no seu próprio canal, digite “/imagine” seguido do texto de instrução. Para iniciar um bate-papo privado com o bot, procure o ícone do Midjourney Bot na lista de usuários no lado direito da tela. Clique com o botão direito sobre ele e selecione “Enviar mensagem” ou “Mensagem”.

Seja o mais específico possível em sua descrição para fornecer à IA informações suficientes para criar a imagem desejada. Por exemplo, você pode incluir detalhes como estilo, gênero, humor e outros elementos para ajudar a IA a criar a aparência que você imagina. Você lerá sobre isso mais adiante no texto.

Também interessante: O que são redes neurais e como funcionam?

- Propaganda -

Como criar prompts eficazes no Midjourney

Qualquer pessoa que já usou o Midjourney sabe que quanto melhor você descrever a imagem que deseja obter, mais brilhante e exclusivo será o resultado. Os usuários geralmente usam prompts curtos e diretos. Por exemplo, depois de dar uma instrução simples como “o robô usa IA para criar gráficos”, Midjourney criará, entre outras coisas, algo assim:

a imagem é criada no meio da jornada
a imagem é criada no meio da jornada

Como você pode ver, instruções tão simples não são suficientes (ou pelo menos nem sempre) para obter os resultados desejados, então a chave para o sucesso é escrever a dica explicativa perfeita.

Você gosta do estilo deste ou daquele artista? Você quer que seus gráficos sejam feitos no estilo de outra época? Ou existe uma técnica específica que você deseja que o gerador de imagens use? Tudo isso pode ser alcançado. A inteligência artificial é um sistema treinado que utiliza inúmeras imagens de entrada para criar gráficos perfeitos a partir delas. A única coisa que você precisa cuidar é dar à IA a melhor descrição possível do que você espera que ela faça. Mas como fazer isso? Felizmente, sabemos a resposta.

Pontuação

A maior parte da pontuação usada nas dicas será ignorada pelo Midjourney. A única pontuação que Midjourney entende é:

  • As opções são separadas por hífens duplos, como “–ar 16:9” ou “–v 5”.
  • Dois pontos duplos separam inteiros, tanto positivos quanto negativos. Por exemplo, “::-0.5”.
  • Os espaços servem como símbolo principal que separa os itens lexicais.

Estruturação de prompts no meio da jornada

Em primeiro lugar, lembre-se que no Midjourney os prompts devem ser escritos em inglês, para que o programa os compreenda melhor. Cada convite começa com o comando /imagine e deve conter uma descrição do que você deseja receber. É bom dar alguma estrutura aos seus prompts. Não é necessário, mas é definitivamente muito útil obter os gráficos desejados o mais rápido possível e alterá-los facilmente, se necessário.

Na primeira parte da descrição, inclua todos os elementos que melhor descrevem a sua imagem. Por exemplo, você pode pedir ao Midjourney que siga um determinado estilo artístico, oferecendo-se para tomá-lo como base. Aqui está um exemplo: “Imagem de um elefante no estilo Van Gogh”:

a imagem é criada no meio da jornada
a imagem é criada no meio da jornada

No entanto, o que é realmente interessante no Midjourney é a sua capacidade de reproduzir imagens que parecem fotografias. Há várias coisas a serem consideradas para isso. Por exemplo, você pode escolher o tipo de câmera que a IA deve emular: SLR para câmeras de filme e DSLR para câmeras DSLR. Você também pode sugerir o tipo de lente (18, 35, 50 ou até 250 mm) e o modelo específico da câmera.

Então você pode fazer comandos adicionais. Eles devem ser precedidos de um sinal “-” e permitir direcionar a IA para aspectos específicos, como versão Midjourney (v 4, v 5), proporção de aspecto (3:2, 16:9, etc.) ou opções de estilo (s 100 para médio, p 250 para alto ou p 750 para muito alto). Valores baixos para a opção de estilo produzem imagens que se aproximam da dica de ferramenta, mas são menos artísticas. Valores altos criam gráficos muito mais artísticos, mas menos relacionados à dica de ferramenta.

Uma lista completa de opções e comandos está disponível no site do Midjourney.

Aqui está um exemplo do prompt e do gráfico resultante:

imagem de um ratinho doce deitado na praia. Foto com Canon R5, 50mm, DSLR, –v 5 –ar 3:2 –s 750

(imagem de um rato fofo deitado na praia. Foto com Canon R5, 50 mm, DSLR, –v 5 –ar 3:2 –s 750)

Iluminação, ambiente, perspectiva – pense em cada detalhe

Para dar contexto às suas fotos, coloque os objetos que você criou em um ambiente específico. Midjourney permite que você torne cenas incríveis ultra-realistas. Você pode querer colocar seu personagem em uma casa decorada com um determinado estilo, na praia ou nas ruas de uma determinada cidade.

Outro aspecto que merece atenção, pois traz ótimos efeitos, é a luz. Ninguém precisa estar convencido de quão importante isso é ao tirar fotos. O mesmo se aplica aos gráficos de IA, que muitas vezes se assemelham a fotos reais.

Dependendo da hora do dia, a iluminação é diferente. Portanto, as cores e os contrastes nas fotos são diferentes. Midjourney é capaz de reproduzir esses contrastes. Por exemplo, você não precisa mais esperar o pôr do sol, basta pedir para criar uma foto específica adicionando a palavra “hora dourada”.

Outro fator com o qual você pode brincar é o ângulo de visão da imagem. Em alguns casos, você precisa ajustar a ótica para isso, o que pode alterar significativamente seus gráficos.

Aqui estão alguns exemplos de ângulos que podem ser incluídos nos avisos no meio da jornada: Para fotos distantes, foto grande angular, foto ultra grande angular, foto geral, vista aérea ou de satélite, foto no nível dos olhos; close up – Up, Retrato Glamour, Macro-Shot ou Macrofotografia.

Aqui está um exemplo de consulta e seu resultado:

um homem bonito andando pelas ruas de Los Angeles, hora dourada Foto com uma Canon R5, 50 mm, DSLR, –v 5 –ar 3:2 –s 750

(homem bonito andando pelas ruas de Los Angeles, hora dourada Foto na Canon R5, 50mm, DSLR, –v 5 –ar 3:2 –s 750)

a imagem é criada no meio da jornada
a imagem é criada no meio da jornada

Edite imagens com dimensionamento e dispersão

Abaixo de cada conjunto de imagens geradas você verá oito botões: U1, U2, U3, U4, V1, V2, V3 e V4. Todos esses botões permitem ajustar e controlar melhor o tipo de imagens do Midjourney.

Se você estiver usando uma versão anterior à V5, os botões U serão usados ​​para aumentar o zoom, ou seja, redimensionar a imagem original, criando uma nova versão maior e com mais detalhes. Eles são numerados de U1 a U4, que são usados ​​para identificar as imagens na sequência. Por exemplo, se quiser ampliar a segunda imagem, pressione o botão U2 na linha superior. Os modelos mais recentes têm como padrão imagens de 1024×1024 pixels, então os botões U simplesmente as destacam para edição posterior e salvamento mais fácil.

À direita, na primeira linha, está o botão Re-roll. Esta é uma ótima ferramenta se você não estiver satisfeito com o primeiro conjunto de imagens que Midjourney criou para você. Clique neste botão de recriação para pedir ao Midjourney que experimente um conceito diferente com base na solicitação original e você obterá quatro novas imagens.

Os botões V criam quatro novas variações da imagem selecionada que combinam com eles em estilo e composição. Ao escolher entre V1 – V4, você pode selecionar o botão que corresponde à imagem para a qual deseja criar variações.

Meio da jornada

E por último mas não menos importante: a função /describe

Por fim, deixei uma grande equipe para facilitar ainda mais a criação da dica perfeita. Esta é uma função /descrever, que permite fazer upload de sua própria imagem e gerar quatro consultas possíveis com base nessa imagem. Como funciona? Após a introdução /descrever uma janela de seleção de fotos do disco do computador aparecerá. Selecione o arquivo gráfico apropriado, carregue-o no servidor e o Midjourney oferecerá 4 sugestões de texto descrevendo-o. Abaixo segue a descrição da foto que enviei:

Meio da jornada

Como você pode ver na imagem acima, para cada uma das quatro descrições fornecidas, haverá botões que permitem utilizar a dica gerada pelo Midjourney. Após selecionar uma imagem, aparece uma janela de texto com a descrição selecionada. Neste ponto, você pode decidir se deseja editar o texto ou deixá-lo como foi criado.

Se você deseja obter os melhores resultados, sugiro que expanda ao máximo a descrição e use apenas como base o texto gerado pelo programa. Após clicar em Enviar, basta aceitar o convite e enviá-lo para Midjourney. Depois de um tempo, você receberá uma resposta com imagens de exemplo:

a imagem é criada no meio da jornada
a imagem é criada no meio da jornada

Para efeito de comparação, segue abaixo a foto que carreguei como exemplo e a foto que selecionei entre as sugestões apresentadas:

Leia também: Sobre computadores quânticos em palavras simples

Quanto custa o meio da jornada? Pode ser usado gratuitamente?

Embora estejamos acostumados com chatbots como ChatGPT e Bing Chat que oferecem uso gratuito quase ilimitado, esse não é o caso dos geradores de imagens. Quase todos eles têm algumas limitações e o Midjourney não é mais gratuito, exceto por alguns curtos períodos promocionais.

Quando o serviço foi lançado pela primeira vez em julho de 2022, qualquer pessoa poderia usá-lo para criar 25 imagens gratuitamente. Tudo que você precisava fazer era criar uma conta gratuita no Discord e entrar no servidor Midjourney. A versão de avaliação gratuita foi ativada imediatamente após o envio da primeira solicitação. No entanto, ao atingir o limite de 25 imagens, você teve que atualizar para um plano pago.

Meio da jornada

Tudo mudou em abril de 2023, quando o CEO da Midjourney anunciou a suspensão do programa de teste gratuito. No último ano, Midjourney se tornou muito popular e os usuários estão ansiosos para compartilhar os gráficos que criam nas redes sociais. Por que os criadores decidiram dar esse passo?

A decisão de abandonar a versão gratuita é fácil de entender. Cada tarefa de imagem requer muito poder computacional, especialmente unidades de processamento gráfico (GPUs). Além disso, cada GPU possui memória de vídeo limitada, que é usada em grandes volumes para o processo de remoção de ruído.

Mais especificamente, os geradores de imagens usam GPUs que consomem muita energia, que não só custam muito dinheiro, mas também estão disponíveis apenas em quantidades limitadas. Portanto, para manter a qualidade dos serviços, a empresa interrompeu o período de teste gratuito até novo aviso, o que não deve surpreender ninguém.

Mas o teste gratuito pode retornar algum dia. Por exemplo, com o lançamento da versão 5.1, Midjourney trouxe de volta o teste gratuito de uma semana.

No entanto, para usar o Midjourney a qualquer momento, você deve adquirir um dos quatro planos de assinatura. O preço mais baixo é de US$ 10 por mês. O que você recebe em troca? Em média, Midjourney cria uma nova imagem em um minuto. No entanto, pode ser necessário gastar um pouco mais de tempo se quiser uma imagem redimensionada ou uma imagem com proporção não quadrada. Portanto, podemos assumir que o plano Básico, mais barato, oferece 3,3 horas de tempo de GPU, o que é suficiente para gerar cerca de 200 gerações de imagens.

A cada assinatura maior, você obtém um limite maior que permite criar mais imagens por mês. Assim, o próximo plano, Standard, oferece 15 horas de geração rápida de imagens e geração mais lenta ilimitada (modo Relax) por US$ 30 por mês. Em seguida vem o plano Pro, que custa US$ 60 por mês e oferece 30 horas de imagens rápidas, imagens mais lentas ilimitadas e modo furtivo.

Em julho de 2023, foi adicionado o plano Mega, que custa US$ 120 e oferece 60 horas de geração rápida de imagens e, claro, horas ilimitadas de modo Relax.

Meio da jornada

Como você pode ver, todos os planos Midjourney de nível superior oferecem fotos ilimitadas no modo Relax, mas você tem que esperar até 10 minutos para obter as imagens.

O nível mais baixo não tem esse recurso, mas por US$ 10 por mês, vale a pena começar sua jornada no meio da jornada. Este plano permite explorar a plataforma, criar imagens e se familiarizar com a interface e como funcionam as sugestões de texto. Se você gosta do que vê, você sempre pode ir para o próximo nível simplesmente digitando o prompt /subscribe para acessar sua conta, onde você pode atualizar facilmente sua ferramenta Midjourney.

Vale lembrar também que a Midjourney às vezes faz promoções e oferece planos anuais com desconto de 20%:

  • Plano básico com assinatura anual – US$ 8 por mês
  • O plano padrão com assinatura anual custa US$ 24 por mês
  • Plano Pro com assinatura anual – US$ 48 por mês
  • Mega plano com assinatura anual – US$ 96 por mês.

Meio de viagem e direitos de propriedade

Os geradores de imagens de IA aprendem com bilhões de imagens de fotógrafos e artistas. O meio da jornada não é exceção. Muitos artistas acreditam que os geradores de imagens de IA estão infringindo direitos autorais ao usar seu trabalho para fins educacionais. Alguns artistas chegaram a apresentar queixas nos Estados Unidos contra geradores de IA, como Midjourney, Stability AI e DeviantArt. No entanto, o outro lado afirma que o processo de aprendizagem se enquadra na categoria de uso justo. Então, quem é o verdadeiro proprietário de uma imagem gerada por IA?

O fundador da Midjourney, David Holtz, admitiu em entrevista à Forbes que utiliza imagens sem o consentimento dos proprietários, pois é praticamente impossível com um conjunto de dados tão grande.

Sabemos que essas imagens não têm direitos autorais, mas os gráficos que você criou poderiam estar sujeitos a direitos autorais? A resposta não é fácil, mas de modo geral, os artistas de IA podem usar, mesmo comercialmente, imagens criadas pela Midjourney, mas não podem impedir que outros as utilizem.

Leia também: 7 usos mais legais do ChatGPT

Alternativas no meio da jornada

DALL-E

DALL-E é a primeira inteligência artificial generativa que se tornou muito popular nas redes sociais. Inicialmente, quando foi lançado em 2021, os gráficos produzidos deixaram muito a desejar. No entanto, a versão mais recente, DALL-E 2, é um outro nível graças à melhor compreensão da linguagem e à maior qualidade de imagem. DALL-E também pode editar imagens existentes, permitindo substituir ou adicionar objetos inteiramente novos.

Criador de imagens do Bing

Se você quiser uma alternativa gratuita ao Midjourney, você pode escolher o Bing Image Creator. O Bing Image Creator está integrado na barra lateral Microsoft Edge, para que você possa acessá-lo enquanto usa o navegador. Graças à parceria Microsoft com OpenAI você pode usar o gerador de imagens DALL-E 2 gratuitamente via Bing.

Dream Studio

Atualmente, o Midjourney só funciona através do Discord, o que pode não ser muito intuitivo de usar. O DreamStudio, por outro lado, oferece um site rico com muitos botões e botões para personalizar, mas pode parecer bastante complicado. DreamStudio usa o modelo aberto de difusão estável.

Sam Stable Diffusion é um software gratuito e de código aberto que você pode instalar e executar em seu computador. No entanto, isso requer algum conhecimento de programação e poder computacional significativo. Por isso, a Stability AI, empresa responsável por este modelo, criou uma plataforma chamada DreamStudio. Semelhante ao modelo Midjourney, o Stable Diffusion cria quatro imagens diferentes com base em um único comando (sugestão). O usuário pode então modificá-los ou utilizá-los como base para a criação de novos gráficos. O modelo também pode ser ajustado para que as imagens geradas sejam mais consistentes com a solicitação do usuário, ou podem ser utilizadas mais etapas de cálculo, o que pode levar a um resultado mais preciso.

Midjourney merece sua atenção?

Midjourney é conhecido por produzir imagens bem estruturadas, definidas e realistas, o que o torna um forte concorrente de outras ferramentas de IA, como DALL-E e Stable Diffusion.

Esta ferramenta pode criar imagens com resolução de até 1792×1024 pixels, o que fornece imagens mais detalhadas.

Midjourney é desenvolvido pelo Discord, uma plataforma de comunicação amplamente utilizada. Os usuários podem interagir com o bot de IA usando comandos simples, tornando-o acessível até mesmo para pessoas sem experiência em programação. Embora ao mesmo tempo esta seja uma de suas desvantagens, pois está vinculado apenas à plataforma Discord. Nem todo mundo vai gostar. Pessoalmente, achei mais fácil instalar o aplicativo Midjourney separadamente.

a imagem é criada no meio da jornada
a imagem é criada no meio da jornada

Embora os desenvolvedores garantam que é o servidor Midjourney Discord que oferece uma comunidade ativa onde os usuários podem compartilhar suas criações, fazer perguntas e obter ajuda de outros usuários e da equipe do Midjourney.

Não gostei que as imagens geradas fossem públicas. Ou seja, as imagens que você cria com o Midjourney não pertencem a você. Você pode usá-los (com restrições), até mesmo comercialmente, mas também podem ser usados ​​de forma bastante legal por outros usuários. Midjourney exibe até mesmo as criações de maior sucesso, incluindo avisos de texto, em seu próprio site.

A equipe da Midjourney trabalha constantemente para melhorar e expandir os recursos de IA, garantindo que a ferramenta permaneça relevante no ambiente de IA em constante evolução. É por isso que a ferramenta não possui versão gratuita. Isso pode não agradar a muitos usuários em potencial, mas vale a pena US$ 10 para gerar suas próprias obras-primas “reais” com Midjourney.

Também interessante: 

Yuri Svitlyk
Yuri Svitlyk
Filho das Montanhas dos Cárpatos, gênio não reconhecido da matemática, "advogado"Microsoft, altruísta prático, esquerda-direita
- Propaganda -
Inscrever-se
Notificar sobre
convidado

1 Comentário
Mais recentes
Os mais velhos O mais popular
Avaliações incorporadas
Ver todos os comentários
Justina
Justina
5 meses atrás

Ótimo artigo! :) Užsisakiau padrão MJ planą. Se você é muito superior, você pode usar suas 10 fotos salvas na Internet, fotos rastų que você pode ver?