FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE6269, 255 aa 1>>>pF1KE6269 255 - 255 aa - 255 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 4.9542+/-0.000831; mu= 16.5819+/- 0.050 mean_var=63.3565+/-12.707, 0's: 0 Z-trim(107.2): 30 B-trim: 0 in 0/50 Lambda= 0.161131 statistics sampled from 9402 (9424) to 9402 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.654), E-opt: 0.2 (0.289), width: 16 Scan time: 1.510 The best scores are: opt bits E(32554) CCDS10626.1 AQP8 gene_id:343|Hs108|chr16 ( 261) 1713 406.6 8.7e-114 CCDS8793.1 AQP5 gene_id:362|Hs108|chr12 ( 265) 448 112.5 2.9e-25 CCDS8792.1 AQP2 gene_id:359|Hs108|chr12 ( 271) 420 106.0 2.7e-23 CCDS8919.1 MIP gene_id:4284|Hs108|chr12 ( 263) 396 100.4 1.3e-21 CCDS58617.1 AQP4 gene_id:361|Hs108|chr18 ( 301) 395 100.2 1.7e-21 CCDS11889.1 AQP4 gene_id:361|Hs108|chr18 ( 323) 395 100.3 1.8e-21 CCDS31798.1 AQP6 gene_id:363|Hs108|chr12 ( 282) 373 95.1 5.5e-20 CCDS5431.1 AQP1 gene_id:358|Hs108|chr7 ( 269) 346 88.8 4.1e-18 >>CCDS10626.1 AQP8 gene_id:343|Hs108|chr16 (261 aa) initn: 1713 init1: 1713 opt: 1713 Z-score: 2156.3 bits: 406.6 E(32554): 8.7e-114 Smith-Waterman score: 1713; 100.0% identity (100.0% similar) in 255 aa overlap (1-255:7-261) 10 20 30 40 50 pF1KE6 MCEPEFGNDKAREPSVGGRWRVSWYERFVQPCLVELLGSALFIFIGCLSVIENG :::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 MSGEIAMCEPEFGNDKAREPSVGGRWRVSWYERFVQPCLVELLGSALFIFIGCLSVIENG 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE6 TDTGLLQPALAHGLALGLVIATLGNISGGHFNPAVSLAAMLIGGLNLVMLLPYWVSQLLG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 TDTGLLQPALAHGLALGLVIATLGNISGGHFNPAVSLAAMLIGGLNLVMLLPYWVSQLLG 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE6 GMLGAALAKAVSPEERFWNASGAAFVTVQEQGQVAGALVAEIILTTLLALAVCMGAINEK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 GMLGAALAKAVSPEERFWNASGAAFVTVQEQGQVAGALVAEIILTTLLALAVCMGAINEK 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE6 TKGPLAPFSIGFAVTVDILAGGPVSGGCMNPARAFGPAVVANHWNFHWIYWLGPLLAGLL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 TKGPLAPFSIGFAVTVDILAGGPVSGGCMNPARAFGPAVVANHWNFHWIYWLGPLLAGLL 190 200 210 220 230 240 240 250 pF1KE6 VGLLIRCFIGDGKTRLILKAR ::::::::::::::::::::: CCDS10 VGLLIRCFIGDGKTRLILKAR 250 260 >>CCDS8793.1 AQP5 gene_id:362|Hs108|chr12 (265 aa) initn: 441 init1: 197 opt: 448 Z-score: 566.9 bits: 112.5 E(32554): 2.9e-25 Smith-Waterman score: 448; 37.7% identity (72.1% similar) in 215 aa overlap (28-238:10-220) 10 20 30 40 50 pF1KE6 MCEPEFGNDKAREPSVGGRWRVSWYERFVQPCLVELLGSALFIFIGCLSVIENGTDTG-L :.. ..:.:.. .:.:.: :... . . CCDS87 MKKEVCSVAFLKAVFAEFLATLIFVFFGLGSALKWPSALPTI 10 20 30 40 60 70 80 90 100 110 pF1KE6 LQPALAHGLALGLVIATLGNISGGHFNPAVSLAAMLIGG-LNLVMLLPYWVSQLLGGMLG :: ::: :::.: . .:: .::::.:::..:: .:.:. ..:. . : ..::.:.. : CCDS87 LQIALAFGLAIGTLAQALGPVSGGHINPAITLA-LLVGNQISLLRAFFYVAAQLVGAIAG 50 60 70 80 90 100 120 130 140 150 160 170 pF1KE6 AALAKAVSPEERFWNASGAAFVTVQEQGQVAGALVAEIILTTLLALAVCMGAINEKTKGP :.. .:.: . : . :. . ::: :.:.:.::: ::: . .. ...:. CCDS87 AGILYGVAPLNARGNLAVNALNNNTTQGQ---AMVVELILTFQLALCIFASTDSRRTSPV 110 120 130 140 150 180 190 200 210 220 230 pF1KE6 LAP-FSIGFAVTVDILAGGPVSGGCMNPARAFGPAVVANHWN-FHWIYWLGPLLAGLLVG .: .:::..::. :.: .: :::::.:::::: :... ::..:.::.....:.. CCDS87 GSPALSIGLSVTLGHLVGIYFTGCSMNPARSFGPAVVMNRFSPAHWVFWVGPIVGAVLAA 160 170 180 190 200 210 240 250 pF1KE6 LLIRCFIGDGKTRLILKAR .: CCDS87 ILYFYLLFPNSLSLSERVAIIKGTYEPDEDWEEQREERKKTMELTTR 220 230 240 250 260 >>CCDS8792.1 AQP2 gene_id:359|Hs108|chr12 (271 aa) initn: 353 init1: 187 opt: 420 Z-score: 531.6 bits: 106.0 E(32554): 2.7e-23 Smith-Waterman score: 420; 35.5% identity (68.4% similar) in 228 aa overlap (24-243:2-222) 10 20 30 40 50 pF1KE6 MCEPEFGNDKAREPSVGGRWRVSWYER---FVQPCLVELLGSALFIFIGCLSVIE-NGTD : : : . ..:.:.. ::.:.: :... . CCDS87 MWELRSIAFSRAVFAEFLATLLFVFFGLGSALNWPQAL 10 20 30 60 70 80 90 100 110 pF1KE6 TGLLQPALAHGLALGLVIATLGNISGGHFNPAVSLAAMLIGGLNLVMLLPYWVS-QLLGG ..:: :.: ::..: .. .::.:::.:.::::..: :.: :. ..:. ::::. CCDS87 PSVLQIAMAFGLGIGTLVQALGHISGAHINPAVTVAC-LVGCHVSVLRAAFYVAAQLLGA 40 50 60 70 80 90 120 130 140 150 160 170 pF1KE6 MLGAALAKAVSPEERFWNASGAAFVTVQEQGQVAGALVAEIILTTLLALAVCMGAINEKT . :::: . ..: . . . :. . :: :...:..:: : :..:. : ... CCDS87 VAGAALLHEITPADIRGDLAVNALSNSTTAGQ---AVTVELFLT--LQLVLCIFASTDER 100 110 120 130 140 150 180 190 200 210 220 230 pF1KE6 KG--PLAP-FSIGFAVTVDILAGGPVSGGCMNPARAFGPAVVANHWNFHWIYWLGPLLAG .: : .: .::::.:.. : : .: :::::...::::..... ::..:.:::. : CCDS87 RGENPGTPALSIGFSVALGHLLGIHYTGCSMNPARSLAPAVVTGKFDDHWVFWIGPLV-G 160 170 180 190 200 210 240 250 pF1KE6 LLVGLLIRCFIGDGKTRLILKAR ..: :. .. CCDS87 AILGSLLYNYVLFPPAKSLSERLAVLKGLEPDTDWEEREVRRRQSVELHSPQSLPRGTKA 220 230 240 250 260 270 >>CCDS8919.1 MIP gene_id:4284|Hs108|chr12 (263 aa) initn: 354 init1: 185 opt: 396 Z-score: 501.7 bits: 100.4 E(32554): 1.3e-21 Smith-Waterman score: 396; 33.3% identity (68.9% similar) in 222 aa overlap (24-238:2-218) 10 20 30 40 50 pF1KE6 MCEPEFGNDKAREPSVGGRWRVSWYER---FVQPCLVELLGSALFIFIGCLSVIENGTDT : : : . ..:.... ...:.: : .. . CCDS89 MWELRSASFWRAIFAEFFATLFYVFFGLGSSLRWAPGP 10 20 30 60 70 80 90 100 110 pF1KE6 -GLLQPALAHGLALGLVIATLGNISGGHFNPAVSLAAMLIGGLNLVMLLPYWVSQLLGGM .:: :.: ::::. .. ..:.:::.: ::::..: .. . ..:. . : ..::::.. CCDS89 LHVLQVAMAFGLALATLVQSVGHISGAHVNPAVTFAFLVGSQMSLLRAFCYMAAQLLGAV 40 50 60 70 80 90 120 130 140 150 160 170 pF1KE6 LGAALAKAVSPEERFWNASGAAFVTVQEQGQVAGALVAEIILTTLLALAVCMGAI-NEKT :::. .:.: : :. :.. .:. : ..::.:: : ...:. : .:. CCDS89 AGAAVLYSVTPPAVRGN---LALNTLHPAVSVGQATTVEIFLT--LQFVLCIFATYDERR 100 110 120 130 140 150 180 190 200 210 220 230 pF1KE6 KGPLAP--FSIGFAVTVDILAGGPVSGGCMNPARAFGPAVVANHWNFHWIYWLGPLLAGL .: :. ...::.... : : .:. :::::.:.::....... ::.::.::...: CCDS89 NGQLGSVALAVGFSLALGHLFGMYYTGAGMNPARSFAPAILTGNFTNHWVYWVGPIIGGG 160 170 180 190 200 210 240 250 pF1KE6 LVGLLIRCFIGDGKTRLILKAR : .:: CCDS89 LGSLLYDFLLFPRLKSISERLSVLKGAKPDVSNGQPEVTGEPVELNTQAL 220 230 240 250 260 >>CCDS58617.1 AQP4 gene_id:361|Hs108|chr18 (301 aa) initn: 383 init1: 211 opt: 395 Z-score: 499.6 bits: 100.2 E(32554): 1.7e-21 Smith-Waterman score: 395; 33.6% identity (68.2% similar) in 223 aa overlap (24-238:8-225) 10 20 30 40 50 pF1KE6 MCEPEFGNDKAREPSVGGRWRVSWYERFVQPCLVELLGSALFIFIGCLSVIE-NGTDTGL : . : . .:.:. .:.... :.:. .::. : CCDS58 MVAFKGVWTQAFWKAVTAEFLAMLIFVLLSLGSTINWGGTEKPL 10 20 30 40 60 70 80 90 100 110 pF1KE6 LQPALAHGLALGLVIATL----GNISGGHFNPAVSLAAMLIGGLNLVMLLPYWVSQLLGG . .: .:: :::. :.:::::.::::..: . .... . : ..: ::. CCDS58 PVDMVLISLCFGLSIATMVQCFGHISGGHINPAVTVAMVCTRKISIAKSVFYIAAQCLGA 50 60 70 80 90 100 120 130 140 150 160 170 pF1KE6 MLGAALAKAVSPEERFWNASGAAFVTVQEQGQVAG-ALVAEIILTTLLALAVCMGAINEK ..::.. :.: .. :. ::. . . .:: .:..:.:.: :.... . ... CCDS58 IIGAGILYLVTPP----SVVGGLGVTMVHGNLTAGHGLLVELIITFQLVFTIFASCDSKR 110 120 130 140 150 160 180 190 200 210 220 230 pF1KE6 TK--GPLAPFSIGFAVTVDILAGGPVSGGCMNPARAFGPAVVANHWNFHWIYWLGPLLAG : : .: ..:::.:.. : . .:. :::::.:::::. ..:. :::::.::.... CCDS58 TDVTGSIA-LAIGFSVAIGHLFAINYTGASMNPARSFGPAVIMGNWENHWIYWVGPIIGA 170 180 190 200 210 240 250 pF1KE6 LLVGLLIRCFIGDGKTRLILKAR .:.: : CCDS58 VLAGGLYEYVFCPDVEFKRRFKEAFSKAAQQTKGSYMEVEDNRSQVETDDLILKPGVVHV 220 230 240 250 260 270 >>CCDS11889.1 AQP4 gene_id:361|Hs108|chr18 (323 aa) initn: 383 init1: 211 opt: 395 Z-score: 499.1 bits: 100.3 E(32554): 1.8e-21 Smith-Waterman score: 395; 33.6% identity (68.2% similar) in 223 aa overlap (24-238:30-247) 10 20 30 40 50 pF1KE6 MCEPEFGNDKAREPSVGGRWRVSWYERFVQPCLVELLGSALFIFIGCLSVIE-N : . : . .:.:. .:.... :.:. . CCDS11 MSDRPTARRWGKCGPLCTRENIMVAFKGVWTQAFWKAVTAEFLAMLIFVLLSLGSTINWG 10 20 30 40 50 60 60 70 80 90 100 pF1KE6 GTDTGLLQPALAHGLALGLVIATL----GNISGGHFNPAVSLAAMLIGGLNLVMLLPYWV ::. : . .: .:: :::. :.:::::.::::..: . .... . : . CCDS11 GTEKPLPVDMVLISLCFGLSIATMVQCFGHISGGHINPAVTVAMVCTRKISIAKSVFYIA 70 80 90 100 110 120 110 120 130 140 150 160 pF1KE6 SQLLGGMLGAALAKAVSPEERFWNASGAAFVTVQEQGQVAG-ALVAEIILTTLLALAVCM .: ::...::.. :.: .. :. ::. . . .:: .:..:.:.: :.... CCDS11 AQCLGAIIGAGILYLVTPP----SVVGGLGVTMVHGNLTAGHGLLVELIITFQLVFTIFA 130 140 150 160 170 170 180 190 200 210 220 pF1KE6 GAINEKTK--GPLAPFSIGFAVTVDILAGGPVSGGCMNPARAFGPAVVANHWNFHWIYWL . ...: : .: ..:::.:.. : . .:. :::::.:::::. ..:. :::::. CCDS11 SCDSKRTDVTGSIA-LAIGFSVAIGHLFAINYTGASMNPARSFGPAVIMGNWENHWIYWV 180 190 200 210 220 230 230 240 250 pF1KE6 GPLLAGLLVGLLIRCFIGDGKTRLILKAR ::.....:.: : CCDS11 GPIIGAVLAGGLYEYVFCPDVEFKRRFKEAFSKAAQQTKGSYMEVEDNRSQVETDDLILK 240 250 260 270 280 290 >>CCDS31798.1 AQP6 gene_id:363|Hs108|chr12 (282 aa) initn: 208 init1: 208 opt: 373 Z-score: 472.3 bits: 95.1 E(32554): 5.5e-20 Smith-Waterman score: 373; 32.9% identity (67.1% similar) in 246 aa overlap (11-248:3-241) 10 20 30 40 50 pF1KE6 MCEPEFGNDKAREPSVGGR-WRVSWYERFVQPC----LVELLGSALFIFIGCLSVIENGT : :: ::: : :. . ..:.:...:..:.: ::.. : CCDS31 MDAVEP--GGRGWASMLACRLWKAISRALFAEFLATGLYVFFGVGSVMRWPT 10 20 30 40 50 60 70 80 90 100 110 pF1KE6 DT-GLLQPALAHGLALGLVIATLGNISGGHFNPAVSLAAMLIGGLNLVMLLPYWVSQLLG ..:: :.. .:. .... . . ::.: ::::.:: .. . ..: . : ..::.: CCDS31 ALPSVLQIAITFNLVTAMAVQVTWKASGAHANPAVTLAFLVGSHISLPRAVAYVAAQLVG 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE6 GMLGAALAKAVSPEERFWNASGAAFVTVQEQGQVAGALVAEIILTTLLALAVCMGAINEK . .:::: .: : . . .. : .:... ... :...:..:: :.: : .. ... CCDS31 ATVGAALLYGVMPGD-IRETLGIN--VVRNSVSTGQAVAVELLLTLQLVLCVFASTDSRQ 120 130 140 150 160 180 190 200 210 220 230 pF1KE6 TKGPLAPFSIGFAVTVDILAGGPVSGGCMNPARAFGPAVVANHWNFHWIYWLGPLLAGLL :.: : . ::..:.. : : .: :::::.::::.. .... ::..:.:::...:: CCDS31 TSGSPATM-IGISVALGHLIGIHFTGCSMNPARSFGPAIIIGKFTVHWVFWVGPLMGALL 170 180 190 200 210 220 240 250 pF1KE6 VGLLIRCFI--GDGKTRLILKAR ..: : :. : :: CCDS31 ASL-IYNFVLFPDTKTLAQRLAILTGTVEVGTGAGAGAEPLKKESQPGSGAVEMESV 230 240 250 260 270 280 >>CCDS5431.1 AQP1 gene_id:358|Hs108|chr7 (269 aa) initn: 354 init1: 180 opt: 346 Z-score: 438.7 bits: 88.8 E(32554): 4.1e-18 Smith-Waterman score: 346; 32.2% identity (65.2% similar) in 227 aa overlap (28-243:10-230) 10 20 30 40 50 pF1KE6 MCEPEFGNDKAREPSVGGRWRVSWYERFVQPCLVELLGSALFIFIGCLSVI----ENGTD : . ..:.:...::.::. :.. :.. CCDS54 MASEFKKKLFWRAVVAEFLATTLFVFISIGSALGFKYPVGNN 10 20 30 40 60 70 80 90 100 110 pF1KE6 TGLLQPALAHGLALGLVIATL----GNISGGHFNPAVSLAAMLIGGLNLVMLLPYWVSQL .: . .::.:: :::: :.:::.:.::::.:. .: ... : : ..: CCDS54 QTAVQDNVKVSLAFGLSIATLAQSVGHISGAHLNPAVTLGLLLSCQISIFRALMYIIAQC 50 60 70 80 90 100 120 130 140 150 160 170 pF1KE6 LGGMLGAALAKAVSPEERFWNASGAAFVTVQEQGQVAGALVAEIILTTLLALAVCMGAIN .:.....:. .... . . .. ..:: : ::: : : :..:. : . CCDS54 VGAIVATAILSGITSSLTGNSLGRNDLADGVNSGQGLGI---EIIGT--LQLVLCVLATT 110 120 130 140 150 180 190 200 210 220 pF1KE6 EKTK---GPLAPFSIGFAVTVDILAGGPVSGGCMNPARAFGPAVVANHWNFHWIYWLGPL .. . : ::..::..:.. : . .: .::::.:: ::...... :::.:.::. CCDS54 DRRRRDLGGSAPLAIGLSVALGHLLAIDYTGCGINPARSFGSAVITHNFSNHWIFWVGPF 160 170 180 190 200 210 230 240 250 pF1KE6 LAGLLVGLLIRCFIGDGKTRLILKAR ..: :. .:: :: CCDS54 IGGALA-VLIYDFILAPRSSDLTDRVKVWTSGQVEEYDLDADDINSRVEMKPK 220 230 240 250 260 255 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Tue Nov 8 11:38:57 2016 done: Tue Nov 8 11:38:57 2016 Total Scan time: 1.510 Total Display time: -0.010 Function used was FASTA [36.3.4 Apr, 2011]